Введение в звездную схему
Схема типа «звезда» - это самый простой подход и модель измерений, в которой таблицы функций, измерения и факты организованы организованным образом и в основном применяются в бизнес-аналитике и хранилищах данных. Схема «Звезда» формируется путем размещения каждого факта с соответствующими измерениями, которые напоминают звезду. Факт - это бесконечный результат, такой как данные о продажах и количество входов в систему. Измерение - это набор справочных данных, включая факты, такие как дата, сведения о продукте и клиентах. Схема «звезда» оптимизирована для запросов больших объемов данных в хранилищах данных, кубов данных оперативной аналитической обработки, а также для специальных запросов.
Как создать звездную схему?
Здесь пользователь собирается создать схему звезды путем преобразования модели взаимосвязи сущностей. Модели отношения сущностей слишком сложны, чтобы объяснить функциональные величины и атрибуты, поэтому они упрощены до размерной схемы звезды следующим образом:
- Найдите корпоративную процедуру из представления сущности-отношения и поймите модель, которую можно разделить на несколько размерных моделей. Отношения сущности состоят из бизнес-данных.
- Найдите много-много таблиц в сущности-связи, которые объясняют процедуру компании, и преобразуйте их в таблицы реальности размерной модели. Эта таблица содержит данные, состоящие из таблицы фактов и таблицы измерений с числовыми значениями и уникальными ключевыми атрибутами.
- Идея этого процесса состоит в том, чтобы дифференцировать информационные таблицы на основе обмена или стертые таблицы. Таким образом, необходимо спроектировать многие отношения. Например, в базе данных ERP есть детали счета, которые являются таблицей обмена. Детали, которые обновляются и обновляются, являются таблицами на основе обмена. Теперь, сравнивая обе таблицы, получается, что данные действительно статичны.
- Таблица реальности - это представление размерной модели, которая показывает множество сетей между конечными измерениями. Это приводит к тому, что внешние ключи в таблицах реальности разделяют многие на многочисленные, что является исчисляемым отношением. большая часть этой таблицы подпадает под таблицы на основе обмена
- Последний шаг в разработке схемы типа «звезда» - это ненормализация резидентных таблиц в таблицы измерений. Обязательный ключ - сделать дубликат ключа. Этот ключ опирается на таблицу реальности, которая помогает лучше понять. Найдите дату и время из дизайна отношения сущностей и заполните таблицу измерений. Даты сохраняются как метки даты и времени. Столбец измерения даты представляет год, месяц или дату или время
Пример: Таблица измерений времени имеет TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, которые могут быть важными критериями таблиц измерений. Точно так же все таблицы имеют уникальный идентификатор и атрибуты. Языки запросов, такие как SQL, могут применяться для интеллектуального анализа данных, хранилища данных и анализа данных.
Синтаксис определения куба:
Define cube (cube-name)(dimension-list): (measure-list)
Кубы развертываются для адресации оповещений на разных уровнях, а время ответа на запрос минимально. Это доступно как предварительно построенный дизайн и применимо в необходимых ситуациях. Создание схемы Star очень просто и эффективно в применении, а также легко адаптируется. Заполнение таблицы фактов и таблицы измерений является обязательным, что, в свою очередь, образует звездочку и может быть сформировано с использованием SQL-запросов или запуска кода. Этот дизайн сделан для лучшего понимания и легкого извлечения данных.
Характеристики звездной схемы
1. Схема «звезда» обеспечивает быстрое агрегирование и расчеты, такие как общее количество проданных товаров и доход, полученный в конце каждого месяца. Эти детали и процесс могут быть отфильтрованы в соответствии с требованиями путем создания подходящих запросов.
2. Он способен фильтровать данные из нормализованных данных и обеспечивать потребности в хранилищах данных. Связанная информация нормализованной таблицы складывается на вкладке нескольких измерений. Для каждой таблицы фактов генерируется уникальный ключ для идентификации каждой строки.
3. Таблица фактов - это измерение конкретных событий, в том числе значений с конечными числами, и состоит из внешних ключей, связанных с таблицами измерений. Эта таблица содержит значения фактов на атомарном уровне и позволяет хранить несколько записей одновременно. Существует три типа таблиц фактов.
4. Таблицы фактов транзакции состоят из данных о конкретных событиях, таких как праздничные события, события продаж.
5. Регистрация фактов за определенные периоды, например, информация о счете в конце каждого квартала.
6. Таблицы с быстрой агрегацией за определенный период называются таблицами накопительного снимка.
7. Таблицы измерений содержат подробные данные атрибутов, записи найдены в таблице фактов. Таблица измерений может иметь различные элементы. Таблицы размеров используются главным образом как таблица измерений времени и даты, таблица размеров продукта и заказа на поставку, сведения о сотруднике и счете, таблица размеров, таблица измерений географии и местоположений. Эти таблицы назначаются с одним целочисленным типом данных, который является дублирующим первичным ключом.
8. Пользователь может создать свой стол в соответствии с требованиями. Например, если ему нужна таблица измерений продаж с ключом продукта и клиента, ключом даты и времени, ключом дохода является доход. Если бизнесмен создает таблицу размеров продукта с ключевыми атрибутами, такими как цвет, дата приобретенного товара, ключ продвижения и ключ клиента.
преимущества
- Он формируется с помощью простой логики и запросов, легко извлекающих данные из транзакционного процесса.
- У него общая логика отчетности, которая подразумевается динамически.
- Схема «звезда» может повысить производительность приложений для составления отчетов.
- Схема «звезда», разработанная путем подачи кубов, применяемых в процессе онлайн-транзакций для построения и обеспечения эффективной работы кубов.
Недостатки
- Это имеет высокую целостность и высокое состояние нормализации. Если пользователь не сможет обновить значения, весь процесс будет свернут. Защита и безопасность не надежны до предела. Он не такой гибкий, как аналитическая модель, и не оказывает эффективной поддержки многим отношениям.
- Схема «звезда» развернута в базе данных, чтобы контролировать более быстрое восстановление данных. Запрос используется для выбора потребности, а не для поиска по всей базе данных. Отфильтрованные и выбранные данные могут применяться в разных случаях. Следовательно, эта звездная схема является простой моделью, которая легко адаптируется.
Рекомендуемая статья
Это руководство к Что такое схема звезды? Здесь мы обсуждаем введение в схему звезды и ее характеристики, а также преимущества и недостатки. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -
- Обзор таблицы фактов
- Схема Звезды против Схемы Снежинки | Главные отличия
- Моделирование хранилища данных с типами
- Базы данных AWS с преимуществами
- AWS Data Pipeline