Введение в звездную схему

Схема типа «звезда» - это самый простой подход и модель измерений, в которой таблицы функций, измерения и факты организованы организованным образом и в основном применяются в бизнес-аналитике и хранилищах данных. Схема «Звезда» формируется путем размещения каждого факта с соответствующими измерениями, которые напоминают звезду. Факт - это бесконечный результат, такой как данные о продажах и количество входов в систему. Измерение - это набор справочных данных, включая факты, такие как дата, сведения о продукте и клиентах. Схема «звезда» оптимизирована для запросов больших объемов данных в хранилищах данных, кубов данных оперативной аналитической обработки, а также для специальных запросов.

Как создать звездную схему?

Здесь пользователь собирается создать схему звезды путем преобразования модели взаимосвязи сущностей. Модели отношения сущностей слишком сложны, чтобы объяснить функциональные величины и атрибуты, поэтому они упрощены до размерной схемы звезды следующим образом:

  • Найдите корпоративную процедуру из представления сущности-отношения и поймите модель, которую можно разделить на несколько размерных моделей. Отношения сущности состоят из бизнес-данных.
  • Найдите много-много таблиц в сущности-связи, которые объясняют процедуру компании, и преобразуйте их в таблицы реальности размерной модели. Эта таблица содержит данные, состоящие из таблицы фактов и таблицы измерений с числовыми значениями и уникальными ключевыми атрибутами.
  • Идея этого процесса состоит в том, чтобы дифференцировать информационные таблицы на основе обмена или стертые таблицы. Таким образом, необходимо спроектировать многие отношения. Например, в базе данных ERP есть детали счета, которые являются таблицей обмена. Детали, которые обновляются и обновляются, являются таблицами на основе обмена. Теперь, сравнивая обе таблицы, получается, что данные действительно статичны.
  • Таблица реальности - это представление размерной модели, которая показывает множество сетей между конечными измерениями. Это приводит к тому, что внешние ключи в таблицах реальности разделяют многие на многочисленные, что является исчисляемым отношением. большая часть этой таблицы подпадает под таблицы на основе обмена
  • Последний шаг в разработке схемы типа «звезда» - это ненормализация резидентных таблиц в таблицы измерений. Обязательный ключ - сделать дубликат ключа. Этот ключ опирается на таблицу реальности, которая помогает лучше понять. Найдите дату и время из дизайна отношения сущностей и заполните таблицу измерений. Даты сохраняются как метки даты и времени. Столбец измерения даты представляет год, месяц или дату или время

Пример: Таблица измерений времени имеет TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, которые могут быть важными критериями таблиц измерений. Точно так же все таблицы имеют уникальный идентификатор и атрибуты. Языки запросов, такие как SQL, могут применяться для интеллектуального анализа данных, хранилища данных и анализа данных.

Синтаксис определения куба:

Define cube (cube-name)(dimension-list): (measure-list)

Кубы развертываются для адресации оповещений на разных уровнях, а время ответа на запрос минимально. Это доступно как предварительно построенный дизайн и применимо в необходимых ситуациях. Создание схемы Star очень просто и эффективно в применении, а также легко адаптируется. Заполнение таблицы фактов и таблицы измерений является обязательным, что, в свою очередь, образует звездочку и может быть сформировано с использованием SQL-запросов или запуска кода. Этот дизайн сделан для лучшего понимания и легкого извлечения данных.

Характеристики звездной схемы

1. Схема «звезда» обеспечивает быстрое агрегирование и расчеты, такие как общее количество проданных товаров и доход, полученный в конце каждого месяца. Эти детали и процесс могут быть отфильтрованы в соответствии с требованиями путем создания подходящих запросов.

2. Он способен фильтровать данные из нормализованных данных и обеспечивать потребности в хранилищах данных. Связанная информация нормализованной таблицы складывается на вкладке нескольких измерений. Для каждой таблицы фактов генерируется уникальный ключ для идентификации каждой строки.

3. Таблица фактов - это измерение конкретных событий, в том числе значений с конечными числами, и состоит из внешних ключей, связанных с таблицами измерений. Эта таблица содержит значения фактов на атомарном уровне и позволяет хранить несколько записей одновременно. Существует три типа таблиц фактов.

4. Таблицы фактов транзакции состоят из данных о конкретных событиях, таких как праздничные события, события продаж.

5. Регистрация фактов за определенные периоды, например, информация о счете в конце каждого квартала.

6. Таблицы с быстрой агрегацией за определенный период называются таблицами накопительного снимка.

7. Таблицы измерений содержат подробные данные атрибутов, записи найдены в таблице фактов. Таблица измерений может иметь различные элементы. Таблицы размеров используются главным образом как таблица измерений времени и даты, таблица размеров продукта и заказа на поставку, сведения о сотруднике и счете, таблица размеров, таблица измерений географии и местоположений. Эти таблицы назначаются с одним целочисленным типом данных, который является дублирующим первичным ключом.

8. Пользователь может создать свой стол в соответствии с требованиями. Например, если ему нужна таблица измерений продаж с ключом продукта и клиента, ключом даты и времени, ключом дохода является доход. Если бизнесмен создает таблицу размеров продукта с ключевыми атрибутами, такими как цвет, дата приобретенного товара, ключ продвижения и ключ клиента.

преимущества

  • Он формируется с помощью простой логики и запросов, легко извлекающих данные из транзакционного процесса.
  • У него общая логика отчетности, которая подразумевается динамически.
  • Схема «звезда» может повысить производительность приложений для составления отчетов.
  • Схема «звезда», разработанная путем подачи кубов, применяемых в процессе онлайн-транзакций для построения и обеспечения эффективной работы кубов.

Недостатки

  • Это имеет высокую целостность и высокое состояние нормализации. Если пользователь не сможет обновить значения, весь процесс будет свернут. Защита и безопасность не надежны до предела. Он не такой гибкий, как аналитическая модель, и не оказывает эффективной поддержки многим отношениям.
  • Схема «звезда» развернута в базе данных, чтобы контролировать более быстрое восстановление данных. Запрос используется для выбора потребности, а не для поиска по всей базе данных. Отфильтрованные и выбранные данные могут применяться в разных случаях. Следовательно, эта звездная схема является простой моделью, которая легко адаптируется.

Рекомендуемая статья

Это руководство к Что такое схема звезды? Здесь мы обсуждаем введение в схему звезды и ее характеристики, а также преимущества и недостатки. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Обзор таблицы фактов
  2. Схема Звезды против Схемы Снежинки | Главные отличия
  3. Моделирование хранилища данных с типами
  4. Базы данных AWS с преимуществами
  5. AWS Data Pipeline