Введение в таблицу размеров
Таблица размеров присутствует в схеме звезды или снежинки. Таблицы измерений помогают описать измерения, то есть значения измерений, атрибуты и ключи. Обычно он маленький по размеру. Размер может варьироваться от нескольких до тысячи строк. Он описывает объекты, представленные в таблице фактов. Таблица измерений относится к сбору или группе информации, относящейся к любому измеримому событию. Они формируют ядро для размерного моделирования. Он содержит столбец, который можно рассматривать как столбец первичного ключа, который помогает однозначно идентифицировать каждую строку или запись измерения. Этот ключ объединяется с таблицами фактов. Когда он создается, ключ, называемый суррогатным ключом, который генерируется системой, используется для уникальной идентификации строк в измерении.
Почему мы должны использовать?
- Это помогает хранить историю информации или размерной информации.
- Его легче понять, чем нормализованные таблицы.
- В таблицу можно добавить больше столбцов, не влияя на существующие приложения, которые их используют.
Типы таблицы размеров
Ниже приведены различные типы таблицы размеров:
1. SCD (медленно меняющиеся размеры)
Атрибуты измерения, которые имеют тенденцию медленно изменяться со временем, а не изменяться через регулярные промежутки времени, называются медленно меняющимися измерениями. Например, адрес и номер телефона меняются, но не регулярно. Давайте рассмотрим пример человека, который путешествует по разным странам, поэтому ему нужно изменить свой адрес в соответствии с этой страной. Это можно сделать тремя способами:
Тип 1: перезаписать предыдущее значение. Этот метод прост в применении и помогает сэкономить место и, следовательно, снизить затраты. Но история теряется в этом сценарии.
Таблица до изменения
Я БЫ | ИМЯ | СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Индия | индийский |
Таблица после изменения
Я БЫ | ИМЯ | СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Китай | индийский |
Тип2: Добавить новую строку с новым значением. В этом методе история сохраняется и может использоваться при необходимости. Но это занимает много места, следовательно, увеличивает стоимость.
Таблица до изменения
Я БЫ | ИМЯ | СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Индия | индийский |
Таблица после изменения
Я БЫ | ИМЯ | СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Индия | индийский |
1001 | Рейчел | Китай | индийский |
Тип 3: Добавить новый столбец. Это лучший подход, так как история может быть легко сохранена.
Таблица до изменения
Я БЫ | ИМЯ | СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Индия | индийский |
Таблица после изменения
Я БЫ | ИМЯ | СТРАНА | СТАРАЯ СТРАНА | НАЦИОНАЛЬНОСТЬ |
1001 | Рейчел | Китай | Индия | индийский |
2. Соответствующее измерение
Это измерение является общим для нескольких предметных областей или витрин данных. То же самое можно использовать в разных проектах без каких-либо модификаций, сделанных в одном и том же. Это используется для поддержания последовательности. Соответствующие размеры - это те, которые являются точно такими же или подходящим подмножеством любого другого измерения.
3. Размер мусора
Измерение мусора - это группа атрибутов с низкой мощностью. Он содержит различные или различные атрибуты, которые не связаны с любым другим атрибутом. Они могут быть использованы для реализации УЗО (быстро меняющихся измерений), таких как флаги, веса и т. Д.
4. Вырожденное измерение
Это атрибуты, которые хранятся в самой таблице фактов, а не в виде отдельной таблицы измерений, эти атрибуты называются вырожденными измерениями. Например, номер билета, номер счета, номер транзакции и т. Д.
5. Ролевая игра Измерение
Наличие нескольких связей с таблицей фактов называется ролевым измерением. Другими словами, это когда один и тот же ключ измерения со всеми связанными с ним атрибутами соединяется со многими внешними ключами, представленными в таблице фактов. Он может выполнять несколько целей в одной и той же существующей базе данных.
Как это работает в хранилище данных?
- Измерение относится к сбору или группе информации, относящейся к любому измеримому событию. Они формируют ядро для размерного моделирования. Когда измерение создается, создается структура проекта. Созданный может использоваться в разных проектах, и это отражает идею повторного использования. Когда в любое из них вносится изменение, его эффект отражается только в этой конкретной таблице. Когда должен быть создан отчет, пользователь может получить данные, поскольку таблицы измерений содержат всю необходимую информацию.
- При выполнении размерного моделирования атомарные данные загружаются в размерные структуры. Затем размерные модели создаются или строятся вокруг бизнес-процессов. При его создании необходимо учитывать фильтрацию значений домена и хранить метки отчетов в этих таблицах. Необходимо убедиться, что суррогатный ключ (системный ключ, используемый при создании таблицы измерений, который помогает однозначно идентифицировать каждую запись, присутствующую в таблице измерений.) Должен использоваться при создании таблицы измерений. Он должен быть денормализован, потому что его задача состоит в том, чтобы позволить пользователю легко и эффективно читать и анализировать данные, а не управлять транзакциями. Основная цель измерения - обеспечить фильтрацию, выполнить группировку и эффективную маркировку.
преимущества
Ниже приведены различные преимущества таблицы размеров:
- У него простая структура.
- Это легко анализировать и понимать.
- Денормализованные данные.
- Помогает хранить историческую информацию для любого измерения.
- Легко получить данные из него.
- Быстро создавать и внедрять.
- Это дает контекстное окружение любого бизнес-процесса.
Вывод - таблица размеров
Это неотъемлемая часть моделирования данных. Используется в схеме звезды или снежинки. Он содержит измерения, ключи и значения атрибутов таблицы фактов. Существуют разные типы, которые используются в разных сценариях.
Рекомендуемые статьи
Это руководство к таблице размеров. Здесь мы обсудили типы, как таблица размеров работает в хранилище данных с преимуществами. Вы также можете просмотреть другие наши статьи, чтобы узнать больше-
- Таблица фактов против таблицы измерений
- Что такое таблица фактов?
- Что такое таблица?
- Смешивание данных в таблице