Что такое визуализация данных?

И почему мы больше не заботимся о круговых диаграммах,

Визуализация данных - это не просто перевод точек данных в ничтожные гистограммы и линейные графики. Это похоже на погружение в океан, который скрывает сокровища на каждом уровне. В самом начале, у нас есть прямое разграничение данных в фигурки из учебников, а именно. точечные диаграммы, линейные графики, круговые диаграммы и гистограммы. Линейные графики обычно используются для отображения тенденции изменения данных с течением времени. В этой теме о том, что такое визуализация данных, мы очистили всю концепцию вперед с помощью данного графика и круговых диаграмм.

Круговые диаграммы

Одна из наиболее распространенных диаграмм - это пицца или круговая диаграмма.

Пропорция газов в смеси.

Источник : сюжет

Обычно используемый во время выборов, чтобы показать, у какой партии есть львы, чтобы разделить голоса, этот график, хотя и чрезвычайно популярен, имеет некоторые явные недостатки. Статистики, такие как Эдвард Туфте, Леланд Уилкинсон и Джеральд ван Белль, выразили свое нежелание использовать круговые диаграммы. Наиболее убедительные доказательства против круговых диаграмм, вероятно, были предоставлены Стивеном Фью, основателем Perceptual Edge. В своей статье «Сохрани пирог на десерт», опубликованной в информационном бюллетене Visual Business Intelligence, Стивен объясняет, почему, к удивлению своих коллег и студентов, он считает, что круговые диаграммы являются неэффективным средством визуализации данных.

Посмотрите на круговую диаграмму ниже.

На этом графике, изображающем долю продуктов, заказанных после 9 часов вечера, легко оценить процент, принадлежащий мороженому - 25%. Однако, после небольшой модификации, больше невозможно легко определить процент заказов на мороженое.

Хотя процент мороженого все тот же на 25%. Это трудно понять из диаграммы выше. На предыдущей диаграмме было легко угадать процент, потому что оттенок для мороженого начинался с позиции 6 часов и растягивался до позиции 9 часов. Поскольку наши глаза обучены видеть часы на 12, 3, 6 и 9 - круговую диаграмму также легче интерпретировать, если ее области придерживаются четырех позиций часов. Заядлый сторонник круговой диаграммы выступит и предположит, что этой проблемы легко избежать, используя метки и отметив процент по каждому региону.

Круговая диаграмма с метками данных

Но опять же, чтобы сопоставить значение с элементом, наши глаза должны продолжать смещать фокус от легенды внизу графика к меткам на графике. Решением этой проблемы будет добавление имени элемента вместе со значениями, чтобы получить что-то похожее на это:

Отлично, вы бы сказали. Но затем я спрашиваю вас: теперь, когда мы добавили названия элементов вместе со значениями, чем круговая диаграмма выше отличается от таблицы ниже:

Чистая таблица с данными, отсортированными по процентам от заказа

Разве эта информация не выглядит намного лучше, чем надписи и легенды, разбросанные по круговой диаграмме. Какая польза от круговой диаграммы тогда? Предполагается, что визуализации добавляют ценность, они являются агентами выводов, они должны заставить данные раскрывать свои секреты. Но в этом случае круговая диаграмма не выполняет свое обещание.

Введите гистограмму визуализации данных

Более скудной и гораздо более элегантной альтернативой круговой диаграмме является гистограмма, которая способна выразить все, что говорит круговая диаграмма, и многое другое, без путаницы надписей и легенд.

Гистограмма, изображающая то же самое - легко сравнивать, контрастировать и делать выводы

Это та же самая информация, которая теперь аккуратно представлена ​​наблюдателю. Помимо отображения отдельных значений, этот график позволяет нам быстро сравнить популярность каждого продукта питания и даже сравнить относительную разницу в стоимости между последовательными элементами. Те же данные были бы доступны через таблицу, но наш мозг лучше обрабатывает изображения, чем расшифровывает текст. Вот почему использование круговой диаграммы со временем сократилось. Хотя это любимое визуальное изображение в медиаиндустрии, его заменили более качественные и сложные представления. Помимо линейных графиков, пирогов и гистограмм, есть множество других диаграмм, которые пригодятся. Один интересный график, но не столь популярный среди непосвященных - это диаграмма Санки. Эта диаграмма используется для выражения распределения и потока материи. Речь может идти об энергии, деньгах или даже воде.

Санки Диаграмма потока энергии и распределения типичного ИТ-сотрудника.

Выше вымышленная диаграмма Санки, показывающая, как и где распределяется большая часть энергии ИТ-сотрудника.

Новые инструменты

С появлением социальных сетей и различных платформ, где люди могут записывать свои чувства, отзывы и мнения, одним из распространенных инструментов визуализации данных является слово-облако. Облака слов помогают нам понять, о чем говорят люди.

Очень реальное, живое облако слов, представляющее отзывы пользователей о PUBG в магазине Google Play.

Если мы посмотрим на облако слов, которое было построено из 80 лучших обзоров игры PUBG в магазине Google Play, мы увидим, что общий ответ на игру «хороший», некоторые люди даже называют его «лучшим», Тем не менее, кажется, есть проблема с некоторыми «обновлениями», о которых люди умоляют создателей игры исправить. Действительно, когда мы проверяем отзывы о магазине в этот день, мы видим то же самое.

Вопрос с обновлениями. Также, посмотрите, можете ли вы найти вхождение слова «пожалуйста» здесь

Будущее

Это просто царапает верхушку айсберга. Такие библиотеки, как plotly и D3, подняли визуализацию данных на другой уровень. Это произошло потому, что спрос тоже изменился. Как бы вы представили умный город на приборной панели? Гигантский экран, на котором могут отображаться жизненные показатели всего города. Трафик, энергопотребление, состояние здоровья в разных районах, качество воздуха и множество других параметров должны отображаться на одной странице. Это требование требует другого подхода к визуализации данных. Итак, мы узнали, что такое визуализация данных с помощью этой концепции. Мы больше не можем придерживаться диаграмм и графиков. Требуется новый подход, когда графики встречаются с искусством и воображением, создавая обогащающий визуальный опыт. Это обсуждение требует совершенно другой статьи. До следующего раза.

Рекомендуемые статьи

Эта статья является полезным руководством о том, что такое визуализация данных. Здесь мы обсудили основные понятия с помощью диаграмм и графиков, чтобы вы могли легко понять визуализацию данных. Вы также можете посмотреть следующую статью, чтобы узнать больше -

  1. Карьера в Oracle Database Administrator
  2. 7 Самая полезная разница между интеллектуальным анализом данных и веб-анализом
  3. Data Analytics Интервью Вопросы
  4. Примеры аналитики больших данных