Что такое таблица?
Визуализация данных связывает или сопоставляет данные с воспринимаемыми и согласованными представлениями, чтобы быстро и всесторонне понять различные аспекты данных, такие как шаблоны, распределения, тенденции и аномалии в массиве массивных данных.
Присущие способности инструментов визуализации, такие как простота использования, улучшенное взаимодействие с элементами данных, степень обобщения для многомерных данных и т. Д., Сделали визуализацию данных развивающейся в качестве ключевой дисциплины в мире, управляемом данными.
Необходимость, сфера и особенности
Огромный темп роста доступных объемов данных и острая потребность в лицах, принимающих решения во всех областях бизнеса и научных исследований для принятия быстрых и точных решений, расширили возможности инструментов визуализации данных для понимания данных с помощью графики. Необходимые усилия и время для создания, поддержки пакетов графики и уровня знаний для понимания графических жаргонов значительно сокращаются.
Существенные особенности, предлагаемые инструментами визуализации данных:
- Простота использования функциональных возможностей инструмента позволяет избежать необходимости углубленного обучения технологиям для создания или взаимодействия представлений с целью получения ценной информации.
- Масштабируемость до быстро растущего размера данных и до повышенной сложности данных, включая скалярные, векторные и тензорные типы данных, без ущерба для производительности инструмента.
- Способность обрабатывать разнородные данные, обладая соединителями данных или анализаторами для различных источников, которые хранят или хранят
- Структурные данные как в реляционных базах данных (Oracle, MySQL, PostgreSQL)
- Полуструктурированные данные, такие как XML-файлы, полезные нагрузки JSON
- Неструктурированные данные в базах данных NoSQL, таких как MongoDB, Couchbase и т. Д.
- Облачное хранилище данных, такое как Oracle Cloud, AWS, Microsoft Azure и т. Д.
- Интеграция функций управления представлениями, таких как нарезка и нарезка кубиками, сворачивание до необходимого уровня детализации, фильтрация данных для помощи в детальном исследовательском анализе данных
- Поддержка семантической визуализации для автоматического выбора подходящих примитивов визуализации, таких как линейные диаграммы, гистограммы, точечные диаграммы, древовидная диаграмма и т. Д. Для номинальных, порядковых и числовых данных.
Одним из самых популярных инструментов визуализации данных является Tableau, который оказался лучшим в визуальном исследовании данных.
Работа с таблицей
Краткое описание ключевых понятий для работы с Tableau:
-
Размеры и меры
Таблица классифицирует данные по измерениям и мерам. Независимые поля, которые не могут быть агрегированы, рассматриваются как измерения, а те поля, которые могут быть агрегированы и зависят от контекста, называются мерами.
Например, рассмотрим набор данных Superstore, в котором регион, год - это измерения, которые предоставляют контекст для добавления значения в показатель продаж, который является суммируемой мерой.
-
Уровень проработанности деталей
Tableau поддерживает три выражения для прохождения уровней детализации:
1. ВКЛЮЧИТЬ - Агрегирование выполняется после группировки списка ВКЛЮЧЕННЫХ полей измерения
(ВКЛЮЧИТЬ (Поле 1), (Поле 2): СУММА ((столбец)))
2. ИСКЛЮЧЕНИЕ - Агрегация выполняется после группировки полей измерения, которые НЕ представлены в списке ИСКЛЮЧЕНИЕ.
(ИСКЛЮЧИТЬ (Поле1), (Поле2), (Поле3): сумма ((столбец)))
3. ИСПРАВЛЕНО - в отличие от выражений «Включить» и «Исключить», агрегированные значения FIXED нечувствительны, то есть остаются неизменными в измененном порядке отображаемых измерений (добавление нового измерения или скрытие существующего измерения) в представлении.
(ИСПРАВЛЕНО (Поле 1): СУММА ((столбец)))
-
параметры
Взаимодействие визуализации может быть улучшено путем параметризации нескольких аспектов представления. Распространенные варианты использования, которые требуют использования параметров:
- Включение Top-N Filters
- Регулировка размера бина гистограмм
- Определение базовой линии для пороговой классификации
Диапазон или список значений параметров, которые пользователи могут изменять или выбирать, должны иметь тот же тип данных, который определен в свойствах параметров.
Как правило, процесс для параметров, используемых в Таблице, включает следующие шаги:
1. Создать новый параметр: каждый случай ввода константы во время создания представления поддерживает опцию - «создать новый параметр», чтобы включить настройку соответствующего аспекта в опубликованном представлении.
2. Показать управление параметрами. Элементы управления параметрами, такие как блоки фильтров, датчики, скользящие полосы и т. Д., Можно сделать видимыми в представлении, выбрав «показать управление параметрами», щелкнув правой кнопкой мыши параметры в области параметров.
3. Используйте параметр в вычислениях: значения параметров, возвращаемые из управления параметрами, можно использовать в вычислениях, функциях или в логических выражениях, чтобы предоставить пользователям возможность отображать желаемую меру / статистику.
-
наборы
Наборы - это созданное вручную или условно вычисленное подмножество входных данных, чтобы упростить настраиваемые элементы изображения в представлении. Особенности наборов:
1. Динамические группы: в отличие от категорий из-за статической группировки, которая может быть создана в измерениях, имеющих большое членство, вычисляемые наборы на основе условной логики, определенной в измерениях или мерах, динамически классифицируют поля при изменении базовых данных.
2. Возможность многократного использования. Хотя фильтры поддерживают условную категоризацию измерений или мер, область применения фильтров ограничена этим измерением в книге, тогда как наборы можно сохранять и повторно использовать в расчетах или как компонент в другом наборе.
3. Порядок приоритета. Наборы имеют более высокий приоритет, чем фильтры измерений или фильтры мер в конвейере запросов, так что список значений, отображаемых для выбора в фильтрах представления, будет оптимальным в соответствии с определением набора.
-
Таблица расчетов
Вычисления таблиц работают с данными, локально видимыми в представлении Таблицы, для получения таких показателей, как промежуточные суммы в подкатегориях, накопленная сумма, скользящее среднее с настраиваемой длиной окна, ранжирование значений полей, процентные различия и т. Д.
Tableau Products
Различные продукты Tableau подразделяются на:
- Продукты для визуализации, которые включают Tableau Desktop и Tableau Public (Desktop)
- Визуализация Публикация продуктов, включающих Tableau Server, Tableau Reader, Tableau Online, Tableau Public (Сервер)
-
Tableau Desktop
Tableau Desktop позволяет пользователям создавать, форматировать и интегрировать различные интерактивные представления и информационные панели, используя богатый набор примитивов визуализации. Он также поддерживает актуальный анализ путем запроса данных, находящихся в различных собственных и подключенных к базе данных базах данных.
Созданные визуализации публикуются путем предоставления доступа к пакетной рабочей таблице Tableau с расширением .twbx, которое включает
- Tableau Workbook с расширением .twb, представляющим собой XML-документ с описанием шаблонов визуализации
- Таблица данных извлекает с расширением .tde файл, который является сжатым файлом источника данных
- Другие вспомогательные файлы, такие как изображения и т. Д.
-
Tableau Server
Tableau Server - это надежная, безопасная и хорошо управляемая среда корпоративного уровня для совместного использования и публикации визуализаций, созданных с использованием Tableau Desktop. Этот продукт выступает в качестве центрального хранилища для различных источников данных в механизме данных, ролей безопасности пользователей и сведений о привилегиях доступа и всех визуализаций во всей компании.
-
Общественная таблица
Tableau Public - это бесплатная облачная версия с ограничениями на использование инструментов, которая поставляется с двумя субпродуктами: Tableau Public (Desktop) и Tableau Public (Server). Представления создаются в Tableau Public (Desktop), которые сохраняются и публикуются в Tableau Public (сервер).
Заметные ограничения в Tableau Public:
- Локально доступные извлечения данных являются единственными поддерживаемыми источниками данных.
- Максимальное количество вводимых строк составляет один миллион.
- В отличие от Tableau Desktop, пользователи не могут сохранять отчет локально и имеют ограничения на сохранение рабочей книги в Tableau Public (Server), доступной для всех ее пользователей.
-
Таблица онлайн
Tableau Online - это облачная платформа для совместного использования представлений с возможностью подключения к облачным базам данных, таким как Amazon Redshift, Google BigQuery и т. Д. Запланированное обновление экстрактов и прямое соединение с локальными хранилищами данных выполняется с помощью моста через таблицу.
- Неотъемлемое преимущество, предлагаемое решением облачных баз, - это снижение затрат на инфраструктуру для своих пользователей за счет избежания связанных с этим действий по обновлению, исправлению и обслуживанию.
- В отличие от сервера Tableau, редактирование рабочих книг и визуализаций требует подключения к серверу данных, и эти операции ограничены максимальным ограничением количества строк.
-
Tableau Reader
Tableau Reader - это настольное приложение, которое позволяет пользователям открывать и выполнять взаимодействия вида, такие как детализация и свертывание кубов OLAP, фильтрация по измерениям и т. Д., Но не может редактировать встроенный контент в опубликованных визуализациях, созданных в Tableau Desktop.
Вывод
Tableau приобрела положительный опыт работы с клиентами и позиционируется как лидер в области вендоров Business Intelligence (BI). Замечательная способность преобразования необработанных данных в визуальные представления была достигнута благодаря предложению большого набора соединителей данных и легкодоступного богатого набора примитивов визуализаций.
В условиях меняющихся потребностей клиентов и растущих ожиданий пользователей Tableau стремится поддерживать подготовку данных с помощью машинного обучения и интеллектуальное обнаружение данных. Помимо этого, Tableau фокусируется на устранении серьезных пробелов в функциях предприятия, которые перечислены ниже:
- Необходимо учитывать производительность при интеграции больших и сложных данных из разнородных данных.
- Планируется улучшить способность обрабатывать большие извлечения в памяти путем замены форматов файлов данных TDE механизмом в памяти, названным Hyper
- Предоставление возможности планирования событий и условных оповещений
- Разработка сервисов интерфейса API для лучшей расширяемости
- Уменьшенная сложность в упаковке для выполнения крупных развертываний легких клиентов
Рекомендуемые статьи
Это было руководство к Что такое Tableau. Здесь мы обсудили ключевые понятия, работу, особенности и продукты Tableau. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -
- Как создать Сет в Таблице?
- Что такое сервер таблиц?
- Использование Таблицы
- Как установить Tableau?
- 10 различных видов альтернативы Tableau