Смешивание данных в Таблице - изучите шаги для выполнения смешивания данных

Содержание:

Anonim

Введение в смешивание данных в таблице

Особенностью, которая ясно изображает универсальный характер Таблицы, является Смешивание данных. Смешивание вообще означает объединение. Часто данные хранятся в нескольких таблицах на разных уровнях. В терминологии базы данных можно сказать, что одни и те же данные находятся в нескольких таблицах, но с разной степенью детализации. Например, таблица содержит объем распределения на региональном уровне, в то время как другая таблица имеет объем распределения на уровне подразделения. Таблицы будут иметь определенные общие поля. Иногда нам могут понадобиться поля из обеих таблиц для анализа. В таких случаях концепция смешивания данных предлагает простое решение для объединения данных из разных источников данных.

Потребность в смешивании данных в таблице

В Таблице смешивание данных относится к объединению данных. Важнейшим аспектом смешивания данных является то, что они объединяют таблицы на уровне представления, фактически не выполняя соединение между таблицами. Потому что Tableau - это по сути инструмент визуальной аналитики, и не всегда возникает необходимость присоединения к таблицам. Более того, комбинация бывает листовой, а не рабочей тетрадью. Это обеспечивает уровень представления, объединяющий особенности смешивания данных.

Смешивание данных в таблице

Теперь мы увидим, как смешивать данные в таблице. Для нашей демонстрации мы рассматриваем данные о распространении. Две разные таблицы содержат данные, относящиеся к объему распределения. Они присутствуют в двух разных файлах Excel. Одна таблица содержит данные на уровне канала распределения, а другая таблица содержит уровень блока распределения данных. Пара полей являются общими в двух таблицах, хотя они существуют с разными именами.

Далее приведена пошаговая процедура смешивания данных в Таблице и использования объединенных данных.

Шаг 1

Загрузка данных из двух таблиц одна за другой

  • В меню «Данные» щелкните «Новый источник данных», выберите нужный источник и загрузите его в «Таблицу».

Выполните вышеуказанный шаг дважды, чтобы загрузить обе таблицы в Tableau. Они должны появиться на вкладке «Данные», как показано на следующем снимке экрана

  • После загрузки оба источника появятся на вкладке «Данные».

Шаг 2

Для смешивания данных мы выполним следующие шаги:

  • Нажмите «Редактировать отношения » в меню «Данные». Появится диалоговое окно Отношения.

  • По умолчанию выбранный источник данных становится основным источником данных.
  • Однако мы можем выбрать необходимый первичный источник данных из выпадающего меню.
  • Если выбран параметр «Автоматически», эти параметры не активны.

  • Необходимый первичный источник данных может быть выбран из выпадающего меню.
  • Нажмите ОК после выбора необходимого источника данных в качестве основного источника данных.

  • При нажатии на кнопку «Добавить» появляется диалоговое окно «Добавить / изменить отображение поля».

  • Используя Add / Edit Field Mapping, мы можем добавить пользовательские поля для отображения данных между двумя источниками данных.
  • Нажмите OK, как только будут сделаны необходимые выборки из двух разделов, т. Е. Поля первичного и вторичного источника данных.

Шаг 3

Как только вышеуказанные шаги будут выполнены, мы проверим, было ли смешивание успешным или нет, используя соответствующие измерения из обеих таблиц.

Шаг 4

Приведенный выше графический анализ показывает разделение объема распределения для продукта. В то время как объем распределения представляет собой числовое поле, присутствующее в обеих таблицах с одинаковым именем, разделение присутствует во вторичном источнике данных, то есть в таблице объема единицы распределения в качестве поля единицы распределения. Через операцию смешивания данных мы объединили две таблицы и сопоставили значения. Итак, на графике мы могли видеть значения кода DU для соответствующих делений. Невыполнение смешивания данных привело бы к появлению пробелов в поле кода DU.

Шаг 5

Обе таблицы содержат данные об объемах распределения, но только на разных уровнях, поэтому разделенные тома для обеих таблиц должны быть одинаковыми, а также общий объем. Давайте проверим это.

Обратите внимание, что, как видно выше, оба графика изображают один и тот же шаблон для разделения объема распределения, хотя мера была выбрана как из первичных, так и из вторичных источников данных. Это показывает, что, хотя он представлен на разных уровнях в разных таблицах, объем распределения останется неизменным. Это еще одно доказательство правильного смешивания данных, которому способствует сопоставление соответствующих полей.

Вывод

Смешивание данных - это простой и быстрый способ объединения данных из нескольких источников в Таблице. На самом деле он не объединяет таблицы, хотя его можно сравнить с левым соединением, в котором основной источник данных рассматривается как левая таблица. Он просто объединяет данные на уровне представления для облегчения подробного графического анализа.

Рекомендуемые статьи

Это руководство по смешиванию данных в таблице. Здесь мы обсуждаем пошаговую процедуру для выполнения смешивания данных в Таблице и как использовать объединенные данные. Вы также можете посмотреть следующую статью, чтобы узнать больше -

  1. Data Science Platform
  2. Приложения для интеллектуального анализа данных
  3. Архитектура больших данных
  4. Data Science Career