Что такое таблица?

Визуализация данных связывает или сопоставляет данные с воспринимаемыми и согласованными представлениями, чтобы быстро и всесторонне понять различные аспекты данных, такие как шаблоны, распределения, тенденции и аномалии в массиве массивных данных.

Присущие способности инструментов визуализации, такие как простота использования, улучшенное взаимодействие с элементами данных, степень обобщения для многомерных данных и т. Д., Сделали визуализацию данных развивающейся в качестве ключевой дисциплины в мире, управляемом данными.

Необходимость, сфера и особенности

Огромный темп роста доступных объемов данных и острая потребность в лицах, принимающих решения во всех областях бизнеса и научных исследований для принятия быстрых и точных решений, расширили возможности инструментов визуализации данных для понимания данных с помощью графики. Необходимые усилия и время для создания, поддержки пакетов графики и уровня знаний для понимания графических жаргонов значительно сокращаются.

Существенные особенности, предлагаемые инструментами визуализации данных:

  • Простота использования функциональных возможностей инструмента позволяет избежать необходимости углубленного обучения технологиям для создания или взаимодействия представлений с целью получения ценной информации.
  • Масштабируемость до быстро растущего размера данных и до повышенной сложности данных, включая скалярные, векторные и тензорные типы данных, без ущерба для производительности инструмента.
  • Способность обрабатывать разнородные данные, обладая соединителями данных или анализаторами для различных источников, которые хранят или хранят
  1. Структурные данные как в реляционных базах данных (Oracle, MySQL, PostgreSQL)
  2. Полуструктурированные данные, такие как XML-файлы, полезные нагрузки JSON
  3. Неструктурированные данные в базах данных NoSQL, таких как MongoDB, Couchbase и т. Д.
  4. Облачное хранилище данных, такое как Oracle Cloud, AWS, Microsoft Azure и т. Д.
  • Интеграция функций управления представлениями, таких как нарезка и нарезка кубиками, сворачивание до необходимого уровня детализации, фильтрация данных для помощи в детальном исследовательском анализе данных
  • Поддержка семантической визуализации для автоматического выбора подходящих примитивов визуализации, таких как линейные диаграммы, гистограммы, точечные диаграммы, древовидная диаграмма и т. Д. Для номинальных, порядковых и числовых данных.

Одним из самых популярных инструментов визуализации данных является Tableau, который оказался лучшим в визуальном исследовании данных.

Работа с таблицей

Краткое описание ключевых понятий для работы с Tableau:

  • Размеры и меры

Таблица классифицирует данные по измерениям и мерам. Независимые поля, которые не могут быть агрегированы, рассматриваются как измерения, а те поля, которые могут быть агрегированы и зависят от контекста, называются мерами.

Например, рассмотрим набор данных Superstore, в котором регион, год - это измерения, которые предоставляют контекст для добавления значения в показатель продаж, который является суммируемой мерой.

  • Уровень проработанности деталей

Tableau поддерживает три выражения для прохождения уровней детализации:

1. ВКЛЮЧИТЬ - Агрегирование выполняется после группировки списка ВКЛЮЧЕННЫХ полей измерения

(ВКЛЮЧИТЬ (Поле 1), (Поле 2): СУММА ((столбец)))

2. ИСКЛЮЧЕНИЕ - Агрегация выполняется после группировки полей измерения, которые НЕ представлены в списке ИСКЛЮЧЕНИЕ.

(ИСКЛЮЧИТЬ (Поле1), (Поле2), (Поле3): сумма ((столбец)))

3. ИСПРАВЛЕНО - в отличие от выражений «Включить» и «Исключить», агрегированные значения FIXED нечувствительны, то есть остаются неизменными в измененном порядке отображаемых измерений (добавление нового измерения или скрытие существующего измерения) в представлении.

(ИСПРАВЛЕНО (Поле 1): СУММА ((столбец)))

  • параметры

Взаимодействие визуализации может быть улучшено путем параметризации нескольких аспектов представления. Распространенные варианты использования, которые требуют использования параметров:

  • Включение Top-N Filters
  • Регулировка размера бина гистограмм
  • Определение базовой линии для пороговой классификации

Диапазон или список значений параметров, которые пользователи могут изменять или выбирать, должны иметь тот же тип данных, который определен в свойствах параметров.

Как правило, процесс для параметров, используемых в Таблице, включает следующие шаги:

1. Создать новый параметр: каждый случай ввода константы во время создания представления поддерживает опцию - «создать новый параметр», чтобы включить настройку соответствующего аспекта в опубликованном представлении.

2. Показать управление параметрами. Элементы управления параметрами, такие как блоки фильтров, датчики, скользящие полосы и т. Д., Можно сделать видимыми в представлении, выбрав «показать управление параметрами», щелкнув правой кнопкой мыши параметры в области параметров.

3. Используйте параметр в вычислениях: значения параметров, возвращаемые из управления параметрами, можно использовать в вычислениях, функциях или в логических выражениях, чтобы предоставить пользователям возможность отображать желаемую меру / статистику.

  • наборы

Наборы - это созданное вручную или условно вычисленное подмножество входных данных, чтобы упростить настраиваемые элементы изображения в представлении. Особенности наборов:

1. Динамические группы: в отличие от категорий из-за статической группировки, которая может быть создана в измерениях, имеющих большое членство, вычисляемые наборы на основе условной логики, определенной в измерениях или мерах, динамически классифицируют поля при изменении базовых данных.

2. Возможность многократного использования. Хотя фильтры поддерживают условную категоризацию измерений или мер, область применения фильтров ограничена этим измерением в книге, тогда как наборы можно сохранять и повторно использовать в расчетах или как компонент в другом наборе.

3. Порядок приоритета. Наборы имеют более высокий приоритет, чем фильтры измерений или фильтры мер в конвейере запросов, так что список значений, отображаемых для выбора в фильтрах представления, будет оптимальным в соответствии с определением набора.

  • Таблица расчетов

Вычисления таблиц работают с данными, локально видимыми в представлении Таблицы, для получения таких показателей, как промежуточные суммы в подкатегориях, накопленная сумма, скользящее среднее с настраиваемой длиной окна, ранжирование значений полей, процентные различия и т. Д.

Tableau Products

Различные продукты Tableau подразделяются на:

  1. Продукты для визуализации, которые включают Tableau Desktop и Tableau Public (Desktop)
  2. Визуализация Публикация продуктов, включающих Tableau Server, Tableau Reader, Tableau Online, Tableau Public (Сервер)
  • Tableau Desktop

Tableau Desktop позволяет пользователям создавать, форматировать и интегрировать различные интерактивные представления и информационные панели, используя богатый набор примитивов визуализации. Он также поддерживает актуальный анализ путем запроса данных, находящихся в различных собственных и подключенных к базе данных базах данных.

Созданные визуализации публикуются путем предоставления доступа к пакетной рабочей таблице Tableau с расширением .twbx, которое включает

  1. Tableau Workbook с расширением .twb, представляющим собой XML-документ с описанием шаблонов визуализации
  2. Таблица данных извлекает с расширением .tde файл, который является сжатым файлом источника данных
  3. Другие вспомогательные файлы, такие как изображения и т. Д.
  • Tableau Server

Tableau Server - это надежная, безопасная и хорошо управляемая среда корпоративного уровня для совместного использования и публикации визуализаций, созданных с использованием Tableau Desktop. Этот продукт выступает в качестве центрального хранилища для различных источников данных в механизме данных, ролей безопасности пользователей и сведений о привилегиях доступа и всех визуализаций во всей компании.

  • Общественная таблица

Tableau Public - это бесплатная облачная версия с ограничениями на использование инструментов, которая поставляется с двумя субпродуктами: Tableau Public (Desktop) и Tableau Public (Server). Представления создаются в Tableau Public (Desktop), которые сохраняются и публикуются в Tableau Public (сервер).

Заметные ограничения в Tableau Public:

  1. Локально доступные извлечения данных являются единственными поддерживаемыми источниками данных.
  2. Максимальное количество вводимых строк составляет один миллион.
  3. В отличие от Tableau Desktop, пользователи не могут сохранять отчет локально и имеют ограничения на сохранение рабочей книги в Tableau Public (Server), доступной для всех ее пользователей.
  • Таблица онлайн

Tableau Online - это облачная платформа для совместного использования представлений с возможностью подключения к облачным базам данных, таким как Amazon Redshift, Google BigQuery и т. Д. Запланированное обновление экстрактов и прямое соединение с локальными хранилищами данных выполняется с помощью моста через таблицу.

  1. Неотъемлемое преимущество, предлагаемое решением облачных баз, - это снижение затрат на инфраструктуру для своих пользователей за счет избежания связанных с этим действий по обновлению, исправлению и обслуживанию.
  2. В отличие от сервера Tableau, редактирование рабочих книг и визуализаций требует подключения к серверу данных, и эти операции ограничены максимальным ограничением количества строк.
  • Tableau Reader

Tableau Reader - это настольное приложение, которое позволяет пользователям открывать и выполнять взаимодействия вида, такие как детализация и свертывание кубов OLAP, фильтрация по измерениям и т. Д., Но не может редактировать встроенный контент в опубликованных визуализациях, созданных в Tableau Desktop.

Вывод

Tableau приобрела положительный опыт работы с клиентами и позиционируется как лидер в области вендоров Business Intelligence (BI). Замечательная способность преобразования необработанных данных в визуальные представления была достигнута благодаря предложению большого набора соединителей данных и легкодоступного богатого набора примитивов визуализаций.

В условиях меняющихся потребностей клиентов и растущих ожиданий пользователей Tableau стремится поддерживать подготовку данных с помощью машинного обучения и интеллектуальное обнаружение данных. Помимо этого, Tableau фокусируется на устранении серьезных пробелов в функциях предприятия, которые перечислены ниже:

  • Необходимо учитывать производительность при интеграции больших и сложных данных из разнородных данных.
  • Планируется улучшить способность обрабатывать большие извлечения в памяти путем замены форматов файлов данных TDE механизмом в памяти, названным Hyper
  • Предоставление возможности планирования событий и условных оповещений
  • Разработка сервисов интерфейса API для лучшей расширяемости
  • Уменьшенная сложность в упаковке для выполнения крупных развертываний легких клиентов

Рекомендуемые статьи

Это было руководство к Что такое Tableau. Здесь мы обсудили ключевые понятия, работу, особенности и продукты Tableau. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Как создать Сет в Таблице?
  2. Что такое сервер таблиц?
  3. Использование Таблицы
  4. Как установить Tableau?
  5. 10 различных видов альтернативы Tableau