Введение в типы визуализации данных

На современной арене больших данных, имеющих более 2, 5 квинтиллионных байтов (1 квинтиллионный байт = 10 18 байт!) Данных, создаваемых каждый день (согласно socialmediatoday.com), существует крайняя необходимость их хранения. Излишне говорить, что эти данные плотны и, следовательно, не так удобны для чтения и постоянно не сфокусированы. Чтобы сменить парадигму простого понимания объема данных и получения полезных преимуществ в бизнесе, данные должны быть представлены более интуитивно понятным образом и, следовательно, потребуются соответствующие диаграммы для их визуализации. Существуют инструменты и методологии, разработанные для эффективного представления данных, но эффективность в основном зависит от типа данных и требований, которые необходимо извлечь из данных.

Что такое визуализация данных?

Визуализация данных - это методология, с помощью которой данные в необработанном формате изображаются, чтобы выявить смысл этого. С появлением больших данных стало необходимым создать осмысленный способ демонстрации данных, чтобы объем данных не становился чрезмерным. Часть изображения данных может использоваться для различных целей, например, для нахождения трендов / общих черт / закономерностей в данных, построения моделей для машинного обучения или для простой операции, такой как агрегация.

Различные типы визуализации данных

Визуализация данных в целом классифицируется на 6 различных типов. Хотя область визуализации данных постоянно растет, неудивительно, если количество категорий возрастет.

Временные: данные для этих типов визуализации должны удовлетворять обоим условиям: представляемые данные должны быть линейными и должны быть одномерными. Эти типы визуализации представлены через линии, которые могут перекрываться, а также имеют общую точку начала и конца данных.
Scatter PlotsИспользует точки для представления точки данных. Наиболее распространен в современном мире машинное обучение при поисковом анализе данных.
Круговая диаграммаЭтот тип визуализации включает в себя круговую графику, где длина дуги обозначает величину.
Полярная диаграммаКак и круговая диаграмма, диаграмма полярной области представляет собой круговую диаграмму, за исключением того, что углы секторов равны по длине, а расстояние от центра обозначает величину.
Линейные графикиКак и на диаграмме рассеяния, данные представлены точками, за исключением того, что они соединены линиями для поддержания непрерывности.
ХронологическиеТаким образом, мы отображаем список точек данных в хронологическом порядке времени.
Последовательности временных рядовВо временных рядах мы представляем величину данных на двумерном графике в хронологическом порядке временных меток в данных.
Иерархический: эти типы визуализаций изображают упорядоченные группы в более крупной группе. На простом языке основная интуиция, лежащая в основе этих визуализаций, заключается в том, что кластеры могут отображаться, если поток кластеров начинается с одной точки.
Древовидная диаграммаНа древовидной диаграмме иерархический поток представлен в виде дерева, как следует из названия. Несколько терминов для этого представления:

- Корневой узел: точка происхождения.

- Дочерний узел: родительский элемент выше

- Конечный узел: больше нет дочернего узла.

Кольцевые диаграммы / Диаграмма солнечных лучейДревовидное представление на древовидной диаграмме преобразуется в радиальную основу. Этот тип помогает представить дерево в кратком размере. Самым внутренним кругом является корневой узел. А область дочернего узла означает% данных.
TreeMapДерево представлено в виде прямоугольников, тесно упакованных. Площадь означает количество содержится.
Круг упаковкаПодобно древовидной карте, он использует круглую упаковку вместо прямоугольников.
Сеть: визуализация этого типа соединяет наборы данных с наборами данных. Эти визуализации показывают, как эти наборы данных связаны друг с другом в сети.
Матричные диаграммыЭтот тип визуализации широко используется для нахождения связи между различными переменными внутри себя. Например, корреляция сюжет
Аллювиальные диаграммыЭто тип блок-схемы, в которой изменения в потоке сети представлены через интервалы по желанию пользователя.

Облако словЭто обычно используется для представления текстовых данных. Слова плотно упакованы, а размер текста обозначает частоту слова.

Диаграммы узловых связейЗдесь узлы представлены в виде точек, и связь между узлами представлена.
Многомерный: в отличие от временного типа визуализации, эти типы могут иметь несколько измерений. В этом мы можем использовать 2 или более функций для создания трехмерной визуализации через параллельные слои. Это позволит пользователю представить ключевые выводы, разбив множество ненужных данных.
Точечные диаграммыВ многомерных данных мы выбираем любые 2 объекта и затем наносим их на двухмерную диаграмму рассеяния. Таким образом, мы получим n C 2 = n (n-1) / 2 графов.
С накоплением гистограммыСегменты представления накладываются друг на друга. Это может быть либо 100% столбчатая диаграмма с накоплением, где сегрегация представлена ​​в%, либо простая столбчатая диаграмма с накоплением, которая обозначает действительную величину
Параллельный координатный участокВ этом представлении нарисован фон, и нарисованы n параллельных линий (для n-мерных данных).
Geospatial: эти визуализации относятся к настоящему реальному физическому местоположению путем скрещивания его с картами (это может быть геопространственная или пространственная карта). Интуиция этих визуализаций заключается в создании целостного представления о производительности.
Карта потокаПеремещение информации или объектов из одного местоположения в другое представлено там, где размер стрелки обозначает сумму.
Choropleth КартаГеопространственная карта раскрашивается на основе определенной переменной данных.
картограммаЭтот тип представления использует тематическую переменную для отображения. Эти карты искажают реальность, чтобы представить информацию. Это означает, что для определенной переменной карты преувеличены. Например, изображение слева является пространственной картой, искаженной для структуры улья.

Тепловая картаОни очень похожи на Choropleth в геопространственном жанре, но могут использоваться и в других областях, кроме геопространственных.
Разное: эти визуализации не могут быть обобщены в особенно большой группе. Таким образом, вместо того, чтобы формировать меньшие группы для отдельного типа, мы группируем его по разному. Несколько примеров ниже:
График Open-High-Low-CloseЭтот тип графиков обычно используется для представления цены акций. Тенденция к увеличению называется бычьей, а понижательная - медвежьей.
Kagi-ChartОбычно спрос-предложение актива представляется с помощью этого графика.

Вывод

Из приведенных выше типов визуализации мы видим, что в целом существует 6 типов групп. Приведенный выше список не является исчерпывающим, но немногие широко используются. В ближайшее время, когда новые типы будут добавлены в список, группы могут увеличиться. Вот и все типы визуализации. Мы продолжим с параметрами, на которые нужно обратить внимание при определении типа визуализации.

Рекомендуемые статьи

Это руководство по типу визуализации данных. Здесь мы обсуждаем введение и различные типы визуализации данных. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Типы методов анализа данных
  2. Интеграция данных Talend
  3. Инструменты анализа данных
  4. Инструменты данных науки
  5. Инструменты для календаря
  6. Что такое интеграция данных?
  7. Разброс графиков в Matlab
  8. Как гистограмма используется в Matlab (примеры)