Введение в таблицу размеров

Таблица размеров присутствует в схеме звезды или снежинки. Таблицы измерений помогают описать измерения, то есть значения измерений, атрибуты и ключи. Обычно он маленький по размеру. Размер может варьироваться от нескольких до тысячи строк. Он описывает объекты, представленные в таблице фактов. Таблица измерений относится к сбору или группе информации, относящейся к любому измеримому событию. Они формируют ядро ​​для размерного моделирования. Он содержит столбец, который можно рассматривать как столбец первичного ключа, который помогает однозначно идентифицировать каждую строку или запись измерения. Этот ключ объединяется с таблицами фактов. Когда он создается, ключ, называемый суррогатным ключом, который генерируется системой, используется для уникальной идентификации строк в измерении.

Почему мы должны использовать?

  • Это помогает хранить историю информации или размерной информации.
  • Его легче понять, чем нормализованные таблицы.
  • В таблицу можно добавить больше столбцов, не влияя на существующие приложения, которые их используют.

Типы таблицы размеров

Ниже приведены различные типы таблицы размеров:

1. SCD (медленно меняющиеся размеры)

Атрибуты измерения, которые имеют тенденцию медленно изменяться со временем, а не изменяться через регулярные промежутки времени, называются медленно меняющимися измерениями. Например, адрес и номер телефона меняются, но не регулярно. Давайте рассмотрим пример человека, который путешествует по разным странам, поэтому ему нужно изменить свой адрес в соответствии с этой страной. Это можно сделать тремя способами:

Тип 1: перезаписать предыдущее значение. Этот метод прост в применении и помогает сэкономить место и, следовательно, снизить затраты. Но история теряется в этом сценарии.

Таблица до изменения

Я БЫИМЯСТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелИндияиндийский

Таблица после изменения

Я БЫИМЯСТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелКитайиндийский

Тип2: Добавить новую строку с новым значением. В этом методе история сохраняется и может использоваться при необходимости. Но это занимает много места, следовательно, увеличивает стоимость.

Таблица до изменения

Я БЫИМЯСТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелИндияиндийский

Таблица после изменения

Я БЫИМЯСТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелИндияиндийский
1001РейчелКитайиндийский

Тип 3: Добавить новый столбец. Это лучший подход, так как история может быть легко сохранена.

Таблица до изменения

Я БЫИМЯСТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелИндияиндийский

Таблица после изменения

Я БЫИМЯСТРАНАСТАРАЯ СТРАНАНАЦИОНАЛЬНОСТЬ
1001РейчелКитайИндияиндийский

2. Соответствующее измерение

Это измерение является общим для нескольких предметных областей или витрин данных. То же самое можно использовать в разных проектах без каких-либо модификаций, сделанных в одном и том же. Это используется для поддержания последовательности. Соответствующие размеры - это те, которые являются точно такими же или подходящим подмножеством любого другого измерения.

3. Размер мусора

Измерение мусора - это группа атрибутов с низкой мощностью. Он содержит различные или различные атрибуты, которые не связаны с любым другим атрибутом. Они могут быть использованы для реализации УЗО (быстро меняющихся измерений), таких как флаги, веса и т. Д.

4. Вырожденное измерение

Это атрибуты, которые хранятся в самой таблице фактов, а не в виде отдельной таблицы измерений, эти атрибуты называются вырожденными измерениями. Например, номер билета, номер счета, номер транзакции и т. Д.

5. Ролевая игра Измерение

Наличие нескольких связей с таблицей фактов называется ролевым измерением. Другими словами, это когда один и тот же ключ измерения со всеми связанными с ним атрибутами соединяется со многими внешними ключами, представленными в таблице фактов. Он может выполнять несколько целей в одной и той же существующей базе данных.

Как это работает в хранилище данных?

  • Измерение относится к сбору или группе информации, относящейся к любому измеримому событию. Они формируют ядро ​​для размерного моделирования. Когда измерение создается, создается структура проекта. Созданный может использоваться в разных проектах, и это отражает идею повторного использования. Когда в любое из них вносится изменение, его эффект отражается только в этой конкретной таблице. Когда должен быть создан отчет, пользователь может получить данные, поскольку таблицы измерений содержат всю необходимую информацию.
  • При выполнении размерного моделирования атомарные данные загружаются в размерные структуры. Затем размерные модели создаются или строятся вокруг бизнес-процессов. При его создании необходимо учитывать фильтрацию значений домена и хранить метки отчетов в этих таблицах. Необходимо убедиться, что суррогатный ключ (системный ключ, используемый при создании таблицы измерений, который помогает однозначно идентифицировать каждую запись, присутствующую в таблице измерений.) Должен использоваться при создании таблицы измерений. Он должен быть денормализован, потому что его задача состоит в том, чтобы позволить пользователю легко и эффективно читать и анализировать данные, а не управлять транзакциями. Основная цель измерения - обеспечить фильтрацию, выполнить группировку и эффективную маркировку.

преимущества

Ниже приведены различные преимущества таблицы размеров:

  • У него простая структура.
  • Это легко анализировать и понимать.
  • Денормализованные данные.
  • Помогает хранить историческую информацию для любого измерения.
  • Легко получить данные из него.
  • Быстро создавать и внедрять.
  • Это дает контекстное окружение любого бизнес-процесса.

Вывод - таблица размеров

Это неотъемлемая часть моделирования данных. Используется в схеме звезды или снежинки. Он содержит измерения, ключи и значения атрибутов таблицы фактов. Существуют разные типы, которые используются в разных сценариях.

Рекомендуемые статьи

Это руководство к таблице размеров. Здесь мы обсудили типы, как таблица размеров работает в хранилище данных с преимуществами. Вы также можете просмотреть другие наши статьи, чтобы узнать больше-

  1. Таблица фактов против таблицы измерений
  2. Что такое таблица фактов?
  3. Что такое таблица?
  4. Смешивание данных в таблице