Основные типы диаграмм в MS EXCEL. Диаграммы и их виды

13.08.2019 Роутеры и модемы

Зачастую графическое представление данных позволяет наглядно понять смысл явления, которое описывается табличными данными. Одним из способов графического изображения зависимости между величинами является диаграмма.

В табличном процессоре MS Excel для представления данных в графической форме можно использовать почти два десятка различных типов диаграмм, причем каждый тип содержит несколько форматов. Для построения диаграмм могут использоваться различные геометрические объекты - линии, плоскости или объемные тела.

Каждый тип диаграмм служит для определенных целей. Обычно пользователь не ограничен жесткими правилами использования какого-либо типа диаграмм для определенных данных. Например, чтобы отобразить итоги продажи по каждому отделу, одинаково хорошо подходят заполненная диаграмма, линейчатая диаграмма, гистограмма или круговая диаграмма. Предположим, что мы располагаем данными об объемах продаж четырьмя региональными торговыми организациями (табл. 6.11).

Таблица 6.11. Объемы продаж по регионам

Регион Январь Февраль Март Апрель Май Июнь
Север 26 20 22 28 24 24
Юг 36 28 34 40 36 30
Восток 31 24 28 34 30 27
Запад 27 27 23 37 30 28

Нетрудно убедиться, что для сравнения динамики изменения объемов продаж лучше использовать графики (рис. 6.32), а для сравнения показателей подразделений друг с другом больше подходит гистограмма (рис. 6.33).

Сравнение этих диаграмм достаточно убедительно показывает, что задача пользователя состоит в том, чтобы выбрать ту диаграмму, которая наилучшим образом отображала бы сущность

Объем продаж, уел. ед.

Рис. 6.32. График изменения объемов продаж

Рис. 6.33. Гистограмма продаж в первом полугодии

того, что следует представить потребителю информации. Поэтому представляется целесообразным рассмотреть краткие характеристики основных типов диаграмм.

График (см. рис. 6.32) представляет собой линию, соединяющую между собой точки, каждая из которых отображает данные, расположенные в одной ячейке. Эта совокупность точек соответствует одному ряду данных. Точки на графике располагаются через равные промежутки. Поэтому график полезен для отображения тенденций изменения данных за равные промежутки времени. Графики отображают данные через некоторые промежутки времени. Данные должны быть последовательными, без пропусков значений. На одном графике можно разместить либо один ряд данных, либо несколько. На представленной диаграмме четко видна взаимосвязь между объемами продаж по каждому региону, но подсчитать итоговый объем продаж по этой диаграмме практически невозможно.

Графики позволяют увидеть и предсказать тенденции развития какого-либо процесса или явления. Иногда важнее видеть тенденцию развития, чем проанализировать реальные данные. (Например, очень важно предугадать уровень инфляции, определить рынок сбыта, прибыль, состояние рынка акций и т. д.) Графики часто используются для отображения информации о деловых и финансовых операциях, таких, как учет прибы- лей/потерь, производства/продажи, отчеты по заработной плате служащих и др.

Гистограмма (см. рис. 6.33) позволяет представить ряд данных в форме вертикально расположенных столбцов, что позволяет сравнивать, например, изменение данных на протяжении отрезка времени. Диаграммы этого типа удобны также для наглядного сравнения различных величин. Ось категорий В на гистограмме располагается по горизонтали, ось значений - по вертикали. Такое расположение осей подчеркивает характер изменения значений во времени.

Заполненные диаграммы (рис. 6.34) отображают изменения объемов производства или потребления во времени, например количество кубометров газа, израсходованного за год; дневное потребление калорий в течение месяца; изменение стоимости коммунальных услуг за год (газ, электричество, телефон и т. д.). Заполненные диаграммы фактически представляют ту же информацию, что и графики. Но при этом она показывает сумму введенных значений и отображает вклад отдельных рядов в об-

Рис. 6.34. Диаграмма с областями (заполненная диаграмма), построенная на основе данных табл. 6.11

щую сумму. Главное достоинство заполненных диаграмм состоит в том, что они позволяют увидеть соотношение отдельных составляющих и общего объема. На рис. 6.34 верхняя линия представляет общий объем продаж по месяцам. Каждая полоса на этой диаграмме - часть общего объема, которая приходится на один регион.

Эта диаграмма позволяет проследить, например, тенденцию к увеличению продаж в целом по всем четырем регионам.

Заполненные диаграммы более наглядны, чем графики, поскольку они в значительной мере отображают картину в целом, а не отдельные изменения. C помощью заполненных диаграмм достигаются две цели: визуально представляются зависимости между сериями данных и указываются их точные значения. Эти диаграммы полезно применять в тех случаях, когда следует обратить внимание получателя информации на потребление или объем продажи, производства и т. п.

Круговая диаграмма в отличие от ранее рассмотренных показывает отношение размеров элементов, образующих только один ряд данных, к размеру их суммы. Используя круговую диаграмму, необходимо постоянно помнить, что они всегда отображают только один ряд данных. Такой тип диаграммы целесообразно использовать, когда необходимо подчеркнуть значение того или иного элемента в их совокупности (рис. 6.35).

Рис. 6.35. Соотношение объемов продаж в регионах за январь (по данным табл. 6.11)

В том случае, когда необходимо решить аналогичную задачу для отображения нескольких рядов данных, следует использовать кольцевые диаграммы. Здесь каждому ряду данных соответствует одно кольцо (рис. 6.36).

Рис. 6.36. Соотношение объемов продаж в регионах за первый квартал (по данным табл. 6.11)

Лепестковая диаграмма позволяет сравнивать совокупные значения нескольких рядов данных (рис. 6.37). В ней каждая категория данных имеет собственную ось координат. Эти оси расходятся лучами от начала координат. Линиями соединяются значения, относящиеся к одному ряду. Диаграммы такого типа по-

Рис. 6.37. Показатели оценки места возможного расположения филиала

лезны в тех случаях, когда необходимо выбрать один объект из нескольких, сравнивая численные показатели их характеристик. Предположим, предприятие планирует открыть филиал. Предварительная оценка каждого из возможных мест расположения филиала приведена в табл. 6.12.

Таблица 6.12, Оценка места возможного расположения филиала (по десятибалльной шкале)

На основании этих данных будет получена лепестковая диаграмма (рис. 6.37).

Точечная диаграмма (рис. 6.38) применяется для отображения отношений между численными значениями в нескольких рядах данных. Этот тип диаграмм особенно полезен, когда нужно сравнить данные, расположенные в разных рядах. Такая необходимость может возникнуть, например, при сравнении расчетных и фактических данных, полученных в ходе эксперимента (табл. 6.13), в котором измерялась температура объекта.

Таблица 6.13. Данные измерений

Время наблюдения 9:00 9:30 10:00 10:30 11:00 11:30 12:00 12:30
Трасч 21,00 21,05 21,10 21,15 21,20 21,25 21,30 21,35
Тфакт 21,62 21,71 21,19 21,33 21,72 21,31 21,35 21,67

Директор по визуальным концепциям компании McKinsey Джин Желязны знает о своей работе все. Это неудивительно: за 55 лет жизни, которые он посвятил изучению диаграмм и других способов визуализации, он накопил достаточный опыт, которым поделился в книге «Говори на языке диаграмм».

Нашим читателям - месяц на Bookmate бесплатно: введите промокод RUSBASE по ссылке http://bookmate.com/code .


Шаг 3. От сравнения к диаграмме – выберете тип диаграммы

Каждому типу сравнения соответствует определенный вид диаграмм. Подбирайте тип визуализации, исходя из типа сравнения.

Формулируем идею

Построение диаграмм начинается с формулирования основной мысли, которую вы хотите донести до аудитории с ее помощью. Основная идея - ответ на вопрос, что именно показывают нам данные и как они связаны между собой.

Самый простой способ сформулировать главную мысль - вынести ее в заголовок диаграммы.

Заголовок должен быть конкретным и нести в себе ответ на вопрос, который вы ставите перед аудиторией. При подборе слов используйте количественные и качественные характеристики и старайтесь избегать общих фраз и выражений.

Примеры конкретных и общих заголовков

Не забывайте главное правило: одна диаграмма - одна идея. Не старайтесь на одном графике показать все найденные вами связи и мысли. Такие диаграммы будут перегруженными и сложными для восприятия.

Определяем тип сравнения

Любую мысль и идею можно выразить при помощи одного из пяти типов сравнения. Ваша задача - правильно выбрать тип сравнения и подобрать к нему соответствующую диаграмму.

Небольшая подсказка:

    Покомпонентное сравнение – ваши данные показывают определенную долю по отношению к целому.

    Позиционное сравнение – вы хотите показать, как данные соотносятся друг с другом.

    Временное сравнение – вы показываете, как данные изменяются во времени.

    Частотное сравнение – вы хотите показать, какое количество объектов попадает в определенные диапазон.

    Корреляционное сравнение – вы показываете, как данные зависят друг от друга.

Выбираем идеальную диаграмму

Каждому из типов сравнения соответствует свой вид диаграмм. Именно от его правильного выбора зависит понятность восприятия визуализированных данных.

Всего существует пять типов диаграмм и некоторые их вариации и комбинации:

1. Круговая диаграмма

Знакомый всем «пирог» – самый используемый тип диаграмм. По мнению Джина, это неоправданно, поскольку этот тип наименее практичен и должен составлять немногим более 5% всех диаграмм в презентациях.

2. Линейчатая диаграмма

Отдельные значения в этой диаграмме представлены полосами различной длины, расположенными горизонтально вдоль оси Х. По мнению автора, это самая недооцененная диаграмма, наиболее гибкий и универсальный тип, который должен был бы составлять 25% всех используемых диаграмм.

3. Гистограмма

Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра.

4. График

Знакомые всем со школы линейные графики состоят из точек на координатной сетке, соединенных линиями. Используются для характеристики вариации, динамики и взаимосвязи. Вместе с гистограммой должны составлять половину используемых диаграмм.

5. Точечная диаграмма

Она же диаграмма рассеивания, служит для размещения точек данных на горизонтальной и вертикальной оси с целью показать степень влияния одной переменной на другую. По мнению Желязны, ее должны использоваться в 10% случаев.

Не забывайте! Главная цель любой диаграммы - четко показать связи или зависимости между данными. Если иллюстрация не способна отразить взаимосвязи, лучше использовать таблицы.

Двойное сравнение

В некоторых случаях возникает необходимость показать на одном графике несколько типов сравниваемых данных и зависимость между ними.

В таких случаях необходимо определить основной тип сравнения и подбирать диаграмму на основании него. Например, если вы хотите показать вклад отдельных подразделений в общий доход компании в зависимости от месяцев, лучше использовать типы диаграмм для временного сравнения: график или гистограмму. А если вас больше интересует не изменение во времени, а конкретные достижения, используйте линейчатые диаграммы.

Помните: если на одной диаграмме не получается просто и понятно донести основную мысль, комбинируя данные, лучше использовать два отдельных виджета.

Шкалы, легенды и другие надписи

Идеальная диаграмма понятна для восприятия без дополнительной информации на ней. Однако это не означает, что вы не можете использовать шкалу или легенду, чтобы лучше донести основную мысль.

Главные правила при добавлении дополнительной информации:

    Они не перегружают диаграмму.

    Они не отвлекают от основной картинки.

    Они дополняют диаграмму.

Конкретные примеры для каждого из типов сравнения и диаграмм вы можете найти в книге или использовать их электронную версию на сайте издательства.

Тема 9. Деловая и научная графика для решения фармацевтических задач в среде табличного процессора

Понятие деловой графики включает методы и средства графической интерпретации научной и деловой информации: таблицы, схемы, диаграммы, иллюстрации, чертежи.

Средства деловой графики предназначены для создания иллюстраций при подготовке отчетной документации, статистических сводок и других иллюстративных материалов. Программные средства деловой графики включаются в состав текстовых и табличных процессоров.

В среде MS Office имеются встроенные инструменты для создания деловой графики. Остановимся подробнее на типах и приемах создания диаграмм в табличном процессоре MS Excel.

Типы и виды диаграмм.

1. Гистограмма (Рис. 1). Отображает значения различных категорий. Виды:

· обычная гистограмма;

· объемный вариант обычной гистограммы;

· трехмерная гистограмма. Показывает раскладку значений по категориям и рядам данных;

· гистограмма с накоплением. Отображает вклад каждой категории в общую сумму;

· объемный вариант гистограммы с накоплением;

· гистограмма, нормированная на 100%. Отражает долю каждой категории в общей сумме;

· объемный вариант нормированной гистограммы.

Рис. 1. Пример гистограммы

2. Линейчатая диаграмма (Рис. 2). По использованию является аналогом гистограммы. Виды те же.

Рис. 2. Пример линейчатой диаграммы

3. График (Рис. 3). Отображает развитие процесса во времени или по категориям. Виды:

· обычный;

· график с маркерами – график, на котором помечены точки данных;

· объемный вариант графика;

· график с накоплением. Хорошо отображает изменение общей суммы по времени или по категориям;

· график с накоплением с маркерами;

· нормированный график. Отображает изменение вклада каждого значения во времени или по категориям;

· нормированный график с маркерами.

Рис. 3. Пример графика.

4.Круговая диаграмма (Рис. 4). Отображает один ряд данных. Виды:

· обычная круговая диаграмма. Отображает долю каждого значения в структуре значения переменной;

· разрезанная круговая диаграмма. Отображает вклад каждого значения в общую сумму, выделяя отдельные элементы;

· объемный вариант обычной круговой диаграммы;

· объемный вариант разрезанной круговой диаграммы;

· вторичная круговая диаграмма – круговая диаграмма с частью значений, вынесенных во вторую диаграмму (для облегчения работы с маленькими секторами в основной диаграмме их можно объединить в один элемент, а затем разбить в отдельную диаграмму рядом с основной);

· вторичная гистограмма – круговая диаграмма с частью значений, вынесенных в гистограмму.

Рис. 3. Пример круговой диаграммы.

5. Кольцевая диаграмма (Рис. 5). Отображает несколько рядов данных, причем каждое кольцо соответствует одному ряду данных и показывает вклад каждого значения в общую сумму ряда. Виды те же, что и у круговой диаграммы.

Рис. 5. Пример кольцевой диаграммы

6. Точечная диаграмма (Рис. 6). Или показывает отношения между численными значениями в нескольких рядах данных, или отображает две группы чисел как один ряд координат X и Y . Эта диаграмма показывает неравные промежутки, или кластеры, данных и обычно используется для отображения результатов научных исследований. Виды:

· точечная диаграмма со значениями, соединенными сглаживающими линиями (с маркерами или без них);

· точечная диаграмма со значениями, соединенными отрезками (с маркерами или без них).

Рис. 6. Пример точечной диаграммы

7. Пузырьковая диаграмма (Рис. 7). Отображает на плоскости наборы из трех значений. Подобна точечной диаграмме, но третья величина отображается размером пузырька.

Чтобы создать пузырьковую диаграмму, расположите данные на листе в строках или столбцах так, чтобы значения X перечислялись в первой строке или столбце, а соответствующие значения Y и значения размеров (Z) - в соседних строках или столбцах. Например, разместите данные на листе, как показано на следующем рисунке.

Рис. 7. Пример пузырьковой диаграммы.

8. С областями (Рис. 8). Хорошо отображает изменение значений ряда с течением времени. Виды:

· обычная;

· диаграмма с областями с накоплением. Отображает как изменение общей суммы, так и изменение вклада отдельных значений;

· нормированная диаграмма с областями. Отображает изменение вклада значений с изменением времени.

Рис. 8. Пример точечной диаграммы

9. Лепестковая диаграмма (Рис. 9). Является аналогом графика в полярной системе координат, отображает распределение значений относительно начала координат. В лепестковой диаграмме каждой категории соответствует своя ось координат. Линиями соединяются значения, относящиеся к одному ряду. Виды:

· обычная;

· лепестковая диаграмма с маркерами;

· заполненная лепестковая диаграмма.

Рис. 9. Пример точечной диаграммы

10. Биржевая диаграмма (Рис. 10). Как следует из названия, биржевая диаграмма наиболее часто используется для иллюстрации изменений цен на акции. Однако эту диаграмму можно также применять и для других областей, в том числе обработки научных данных. Например, биржевая диаграмма используется для отображения колебаний дневных или годовых температур, колебаний объемов продаж и т.д.

· обычная. Отображает наборы данных из трех значений (например, самый высокий курс, самый низкий курс, курс закрытия);

· биржевая диаграмма для наборов из четырех значений (курс открытия, курс закрытия, самый высокий курс, самый низкий курс);

· биржевая диаграмма для наборов из четырех значений (курс закрытия, самый высокий курс, самый низкий курс, объем). Для объема используется дополнительная ось, параллельная оси Y ;

· биржевая диаграмма для наборов из пяти значений (курс открытия, курс закрытия, самый высокий курс, самый низкий курс, объем).

Способ расположения данных, которые будут использованы в биржевой диаграмме, очень важен. Например, чтобы создать простую биржевую диаграмму, данные должны быть распределены таким образом:

Рис. 10. Пример биржевой диаграммы

11. Поверхность (Рис. 11). Отображает изменение значений по двум измерениям в виде поверхности. Такую диаграмму целесообразно использовать для поиска наилучшего сочетания в двух наборах данных. Виды:

· обычная – области, относящиеся к одному диапазону, выделяются одинаковым цветом или узором;

· проволочная (прозрачная);

· контурная. Представляет собой вид сверху на поверхность диаграммы. Цвета представляют интервалы значений;

Рис. 11. Пример диаграммы «Поверхность».

12. Коническая, цилиндрическая, пирамидальная диаграмммы (Рис. 12)– гистограммы или линейчатые диаграммы, в которых значения представлены не прямоугольниками, а конусами, цилиндрами или пирамидами.

Рис. 12. Коническая диаграмма.

Существуют еще и нестандартные типы. Из них наиболее интересным и иллюстративным является совмещенная диаграмма, включающая гистограмму и график (Рис. 13).

Рис. 13. Совмещенная диаграмма

Кроме указанных выше видов диаграмм, MS Excel предоставляет пользователю средство для иллюстрации структурированного отчета по нескольким таблицам данных, характеризующим некоторую сферу. Это так называемый отчет сводной диаграммы.

Отчет сводной диаграммы – интерактивная диаграмма с данными графического анализа существующих списков, баз данных и отчетов сводных таблиц. Создав отчет сводной диаграммы, его можно просматривать на различных уровнях подробности. Для изменения структуры диаграммы можно перетаскивать мышью ее поля и элементы или выбирать в раскрывающихся списках полей элементы, которые должны отображаться на экране.

Отчет сводной диаграммы следует использовать в случаях, когда требуется быстро изменять вид диаграммы и просматривать данные в различных представлениях для сравнения данных и выявления тенденций.

Прежде чем составить какой либо график, необходимо определиться с вопросом о том, какие виды диаграмм вас именно интересуют.

Рассмотрим основные из них.

Гистограмма

Само название этого вида позаимствовано из греческого языка. Дословный перевод - писать столбом. Это своеобразный столбчатый такого вида могут быть объемные, плоские, отображать вклады (прямоугольник в прямоугольнике) и т.д.

Точечная диаграмма

Показывает взаимную связь между числовыми данными в некотором количестве рядов и представляет собой пару групп цифр или чисел в виде единственного ряда точек в координатах. Виды диаграмм такого типа отображают кластеры данных, используются для научных целей. При предварительной подготовке к построению точечной диаграммы все данные, которые вы хотите расположить по иксовой оси, следует расположить в одной строке/столбце, а значения по оси «игрик» - в смежной строке/столбце.

Линейчатая диаграмма и график

Диаграмма линейчатая описывает некое соотношение отдельных данных. На такой диаграмме значения располагаются по вертикальной оси, категории же - по горизонтальной. Из этого следует, что большее внимание такая диаграмма уделяет сопоставлению данных, нежели изменениям, происходящим с течением времени. Данный вид диаграмм существует с параметром «накопление», что позволяет показать взнос отдельных частей в общий конечный результат.

График же отображает последовательность изменений числовых значений за абсолютно равные промежутки времени.

Эти виды диаграмм наиболее часто используются для построений.

Диаграммы с областями

Основной целью такой диаграммы является акцент на величине изменения данных в течение некоторого периода, путем показа суммирования введенных значений. А также отображение доли отдельно взятых значений в общей сумме.

Кольцевая и круговая диаграммы

Диаграмм весьма схожи по целям. Обе они отображают роль каждого элемента в общей сумме. Их отличие заключается лишь в том, что диаграмма кольцевая имеет возможность содержать несколько рядов с данными. Каждое отдельное вложенное кольцо представляет собой индивидуальный ряд значений/данных.

Пузырьковая

Одна из разновидностей точечной. Величина маркера зависит от величины третьей переменной. При предварительной подготовке располагать данные следует точно так же, как и при подготовке к построению точечной диаграммы.

Биржевая диаграмма

Использование таковой часто является неотъемлемым процессом при продаже акций или других ценных бумаг. Также возможно ее построение для наглядного определения изменения Для трех и пяти значений такой вид графика может содержать в себе пару осей: первую - для столбиков, которые представляют интервал неких колебаний, вторую - для изменения ценовой категории.

Это лишь малая часть типов диаграмм, которые могут вам понадобиться. Виды диаграмм в Excel весьма разнообразны. Выбор всегда зависит от целей. Так что определяйтесь с тем, что вы хотите получить в конечном итоге, а мастер построения поможет определиться!

— В некотором смысле, показывая человеку круговую диаграмму, вы можете оскорбить его интеллектуальные способности

К. Г. Карстен, «Диаграммы и графики» (1923)

Первые негативные выпады в сторону круговых (секторных) диаграмм начались более 100 лет назад. В 1914 году инженер и сторонник визуализации, Виллард Бринтон (Willard Brinton), опубликовал работу под названием «Графические методы», которую принято считать первой книгой о правильной визуализации данных для широкой аудитории. Он был Эдвардом Тафтом своего времени: пропагандистом наглядного обмена информацией и памфлетистом плохих форм.

Значительная часть книги Бринтона предостерегает читателей от использования круговых диаграмм (pie chart). В самой первой главе, описывая «составные элементы», автор объясняет:

«Круговая диаграмма, вероятно, используется гораздо чаще, чем любая другая форма, для демонстрации пропорций элементов. Однако, круг с секторами — это далеко не оптимальная форма, поскольку он и близко не обладает такой же выразительностью, как столбиковые диаграммы. Недостатком секторного представления является невозможность размещения частей таким образом, чтобы их можно было легко сравнить или просуммировать».

С тех пор, как Бринтон написал эти слова, многие статистики и эксперты в области визуализации выступили против секторных диаграмм и настаивали на использовании различных альтернатив. Хотя изначально в своих суждениях критики апеллировали к логике, за последние 40 лет они отыскали экспериментальные доказательства, которые указывают на неполноценность таких диаграмм в плане точности передачи информации.

Тем не менее, круговые диаграммы остаются весьма востребованными. Крупные издательства и медиа-корпорации, например, The Walt Street Journal и Target Corporation, до сих пор используют их, чтобы отображать свои данные. Кроме того, некоторые веб-ресурсы также задействуют этот довольно спорный графический метод.

Чтобы понять суть проблемы, вернемся к ее истокам и рассмотрим аргументы сторонников и критиков секторных диаграмм.

История возникновения

Отцом современной визуализации данных можно по праву назвать Уильяма Плейфэра (William Playfair). Он родился в Шотландии в 1759 году и вел очень увлекательный образ жизни. Плейфэр принимал участие во взятии Бастилии, внес свой вклад в развитие телеграфа и, конечно же, опубликовал первую круговую диаграмму. Он также является создателем столбиковой и линейной диаграмм.

Круговая диаграмма является одной из многих инноваций шотландского «мошенника» Уильяма Плейфэра

На рубеже XVIII века, использование иллюстраций в серьезной интеллектуальной литературе считалось слишком детским подходом. Но, как свободно мыслящего человека, Плейфэра это не остановило.

В 1801 году он опубликовал «Статистический Бревиарий» (Statistical Breviary) — книгу, посвященную демографическим и экономическим данным европейских государств. В этой работе, которая содержала первую круговую диаграмму, Плейфэр аргументирует ценность использования графических элементов: «Создание визуального образа для наших глаз при сохранении всех пропорций и размеров — это наиболее оптимальный и читабельный способ выражения определенной идеи».

Секторная диаграмма, опубликованная на страницах «Статистического Бревиария», показана ниже. На ней изображены доли земельных участков Турецкой Империи, расположенных в Азии, Африке и Европе тех времен. Этот рисунок принято считать первой круговой диаграммой, где идея о целом была представлена в виде круга, а для различия секторов использовался цвет.

Распределение площади Турецкой Империи является первой известной секторной диаграммой

Но как Плейфэр пришел к такой идее?

Некоторые эксперты считают, что секторная диаграмма обязана своим появлением кругам, которые использовались для представления понятий в философии и математике. Брат Плейфэра, Джон, был уважаемым математиком и ученым. Вполне вероятно, что Уильям увидел разделенный круг, изображающий составные части категории, в одной из его работ. Математики и философы применяют этот тип иллюстрации еще с XIV века.

Пример использования круга для представления составных частей в XIV веке

Секторная диаграмма, впрочем как и другие инновации Плейфэра, обрела широкое распространение не сразу. В то время Уильяма считали «мошенником» и нечистым на руку бизнесменом, поэтому, как правило, его идеи игнорировались.

Так продолжалось до 1850-х годов, пока круговая диаграмма не обрела еще одного важного сторонника — французского инженера Чарльза Джозефа-Минарда (Charles Joseph-Minard), который подтвердил эффективность данного метода. Минард был «пионером» статистических графиков и, по мнению многих, создателем самых гениальных методик визуализации данных.

Будучи в первую очередь картографом, Минард дополнил круговыми диаграммами свои карты. На размещенном ниже примере он изобразил в виде таких диаграмм количество мяса, поставляемого в парижские магазины из различных регионов Франции. Размер круга представляет общее количество мяса, и каждый круг разделен пропорционально на доли баранины, телятины и говядины:

Карта, созданная пионером визуализации данных Чарльзом Джозефом-Минардом в 1858 году, с использованием круговых диаграмм

Изобретение секторной диаграммы иногда ошибочно приписывают легендарной британской медсестре и общественному деятелю Флоренс Найтингейл (Florence Nightingale). В 1858 году она распределила причины смертности британских солдат в Крымской войне по месяцам. Флоренс использовала эту диаграмму, чтобы убедить правительство Великобритании улучшить санитарные условия и питание в военных лагерях.

Несмотря на то, что ее чертеж смотрится очень мощно и убедительно, на самом деле он не является круговой диаграммой. Это так называемая областная диаграмма (polar-area chart), в которой круг делится на ровные части, но их длина зависит от величины переменной:

Областная диаграмма Флоренс Найтингейл, которую часто путают с круговой диаграммой

Критика в адрес круговой диаграммы

Первые сто лет истории круговой диаграммы были мирным временем, но буря уже надвигалась. Слова Бринтона, которые мы цитировали в начале поста, являются самым ранним примером критики в сторону данной инновации, но к 1920 году в мире появилось еще больше литературы, резко осуждающий этот метод.

В 1923 году американский экономист Карл Густав Карстен (Karl G. Karsten) согласился с предупреждением Бринтона касательно секторных диаграмм. Заявления Карстена в его книге «Диаграммы и графики» (Charts and Graphs) удивительно похожи на те, что мы слышим сегодня:

«У секторной диаграммы очень много недостатков. Во-первых, человеческий глаз не может нормально сравнить длину дуги окружности, поскольку секторы направлены в различные стороны. Во-вторых, человеческое зрение не приспособлено к сравнению углов в принципе…

Наконец, невозможно эффективно оценить величину областей, особенно если они представлены в виде неравномерных секторов в круге. Не существует способа, который бы позволял сравнивать компоненты круглой фигуры так же быстро и точно, как части прямой линии или столбца»

Однако, хотя подобные выпады звучали все чаще, статистик Вальтер Кросби Иллс (Walter Crosby Eells) отметил, что многие критические замечания основываются «исключительно на личных предпочтениях». Иллс и другие решили проверить это предположение.

Ранние исследования в этой области были направлены на то, чтобы выяснить, пропорции какой разделенной фигуры — круга или столбца — люди определяют более точно. В ходе эксперимента 1927 года, проведенного Фредериком Крокстоном (Frederick Croxton) и Роем Страйкером (Roy Stryker), ученые попросили более 800 испытуемых угадать пропорции каждого компонента различных сегментированных фигур:

В данном случае пропорции практически идентичны.

Исследователи рассчитали среднюю погрешность предположений респондентов, но в этом эксперименте и многих других экспериментах ученым так и не удалось отыскать серьезных доводов, дискредитирующих круговые диаграммы. Сторонники данного типа визуализации до сих пор используют результаты проведенных в 1927 году исследований, чтобы аргументировать свою точку зрения.

Тем не менее, как отметил ученый Майкл Макдональд-Росс (Michael Macdonald-Ross) в обширном обзоре «Конфронтации круга и столбца», эти первоначальные эксперименты на самом деле не отображают реальное положение вещей. Несмотря на то, что сегментированный столбец в то время считался основной альтернативой кругу, сегодня специалисты практически всегда предлагают использовать гистограммы или точечные диаграммы.

Основной и, возможно, наиболее мощный удар по секторным диаграммам пришелся на 1980-е года, благодаря усилиям статистика Уильяма Кливленда (William Cleveland). Кливленд является автором новаторской книги «Элементы графических данных», в результате которой, как многие считают, визуализация данных обрела научную основу. Его работа не только описывает базовые «задачи восприятия», решаемые при просмотре диаграммы (например, суждения касаемо длины или площади), но и утверждает, с какими из них люди справляются лучше всего.

В эксперименте, проведенном в 1984 году, Кливленд и его друг, исследователь Роберт МакГилл (Robet McGill) тестировали круговую диаграмму. Вместо того, чтобы сравнивать ее с сегментированным столбцом, они сопоставили разделенный на части круг с его истинным конкурентом — гистограммой:.

В эксперименте Кливленда задачей восприятия гистограммы было определение позиции на шкале, а при просмотре круговых диаграмм — угол сегмента. Ученые обнаружили, что гипотез на счет высоты столбцов гистограммы были в 1,96 раз точнее, чем суждения, касающиеся угла. Кливленд отметил: «Круговые диаграммы не обеспечивают эффективную передачу информацию о разнице значений».

После этого, статистик Наоми Роббинс (Naomi Robbins) проводила исследования, чтобы понять, почему мы так плохо определяем углы. В книге «Создание более эффективных графиков» (Creating More Effective Graphs) она пишет, что, как правило, люди склонны недооценивать острые углы и переоценивать тупые. Роббинс также утверждает, что сегменты круга, направленные в стороны, кажутся большими, чем те, что размещены вверху или внизу.

Это исследование подбодрило ярых противников секторных диаграмм, к которым относятся и сегодняшние ведущие специалисты в области визуализации данных — Эдвард Тафт (Edward Tuft) и Стивен Фью (Spethen Few). Тафт пишет: «Таблица практически всегда лучше, чем дурацкая круговая диаграмма, а Фью добавляет: «Пироги можете оставить на десерт» (pie — пирог по-английски).

Кроме того, круговые диаграммы постоянно высмеиваются популярными СМИ, например, в Washington Post, и в New York Times:

Круговая диаграмма, демонстрирующая эффективность круговой диаграммы

Тем не менее, у этого инструмента есть и свои защитники.

Доводы в защиту круговой диаграммы

По мнению многих пользователей, основным преимуществом круговой диаграммы является то, что все сегменты выглядят частью чего-то целого. К примеру, рассматривая график населения страны, распределенного по возрастным группам, зритель понимает, что представленные данные касаются всех людей, проживающих в этой стране. Это допущение не будет столь очевидным в случае с гистограммами.

Некоторые ученые также оспаривают эмпирическую литературу, которая резко критикует секторные диаграммы. Пожалуй, ни один человек не потратил больше времени на поиск аргументов в пользу этих диаграмм, чем психолог Ян Спенс (Ian Spence). В своей книге «Возникновение и использование статистических диаграмм (No Humble Pie: The Origins and Usage of a Statistical Chart) он активно защищает этот осуждаемый многими визуальный элемент.

Спенс утверждает, что исследования восприятия «пирожковых» диаграмм плохо проработаны. Он считает работу Кливленда ошибочной, поскольку в ней испытуемых просят сравнить размеры отдельных сегментов круга, а не оценить величину сегмента по отношению к целой фигуре. По его мнению, круговые диаграммы чаще используются для второй цели. Ссылаясь на другое исследование 1987 года, Спенс заявляет, что в этом плане секторные диаграммы и сегментированные столбцы абсолютно идентичны. Он пишет:

«На мой взгляд, чаще всего круговые диаграммы критиковали люди, которые хотели сделать больше, чем могли на самом деле. Секторная диаграмма — это простой информационный график, и его основное назначение заключается в демонстрации связи между сегментом и целой фигурой»

Исследование 2013 года о толковании человеком круговых диаграмм и столбцов дало сторонникам «пирогов» еще больше аргументов. В ходе эксперимента, проведенного Университетом Тафтса для измерения психической энергии, требуемой при просмотре различных графиков, использовалась около инфра-красная спектроскопия. Авторы обнаружили, что круговые диаграммы оцениваются не менее точно и что среднестатистический человек не считает их изучение более утомительным, чем просмотр гистограмм.

Однако, критикуя данное исследование, Стивен Фью утверждает, что заявления, сделанные психологами, ошибочны и безответственны. Эксперимент проверял способность людей делать гипотезы касаемо отдельных диаграмм (круговой и столбиковой), а не одной и той же. По словам Фью, на самом деле, глядя на эти графики, респонденты должны были действовать не совсем так, поэтому данная работа не имеет большого значения.

Другие считают, что секторная диаграмма может быть полезной, когда она используется редко и в эстетических целях. Нейтан Яу (Nathan Yau) из Flowing Datapoints говорит, что даже если предположения об углах в круговой диаграмме не так точны, как в других случаях, это не особо важно, ведь на практике выдвигать такие допущения не нужно практически никогда (в частности, когда на чертеже изображено только два или три значения). При определенных обстоятельствах, круговую диаграмму выбрать даже лучше, чисто из дизайнерских соображений:

Эта диаграмма не очень информативна с точки зрения представления данных, но она красива и оригинальна (Sky — небо, Sunny side of pyramid — солнечная сторона пирамиды, Shady side of pyramid — теневая сторона пирамиды)

Вместо заключения

Даже после столетних споров об их полезности, круговые диаграммы никуда не делись. На защиту (как и на критику) этого визуального инструмента представления данных было затрачено много энергии, при этом ученым так и не удалось объяснить привлекательность данной фигуры. Возможно, она связана с тем, что это первый тип диаграмм, с которыми люди сталкиваются еще в школе, или же нам попросту нравятся круги. А может, стоит винить Microsoft за то, что они добавили секторные диаграммы в Excel.

Так или иначе, по мере увеличения роли информации и цифровых данных в современной жизни, их грамотная визуализация требует все больше внимания. Многие уже выступают за то, чтобы статистика стала обязательной дисциплиной для изучения в старших классах. Как знать, возможно, благодаря более широкому использованию гистограмм и других графических методик, круговые диаграммы наконец утратят свою актуальность. Или нет.