Что такое модель данных?

Интерпретация и документирование существующих процедур проектирования и разработки программного обеспечения и транзакций называются информационным моделированием. Методы и инструменты информационного моделирования упрощают сложные системы, упрощая реинжиниринг для обработки информации. Он используется для разработки информационного хранилища логически и физически. В этой теме мы узнаем о моделировании хранилищ данных.

Потребность в моделировании хранилища данных

  1. Сбор бизнес-требований
  2. Улучшение производительности базы данных
  3. Предоставляет документацию исходной и целевой системы

1. Сбор бизнес-требований

Хранилище данных обычно предназначено для определения сущностей, необходимых для хранилища данных, и фактов, которые должны быть записаны архитекторами данных и бизнес-пользователями. Этот первый дизайн имеет много итераций, прежде чем окончательная модель будет решена.

На этом этапе мы должны преодолеть преобладающие недостатки на этапе проектирования. Поскольку существующая система реализует хранилище данных, архитекторы иногда включают значительную часть старой системы в новый дизайн, экономя время или раскрытие информации.

Логическая модель эффективно отражает потребности компании и служит основой для физической модели.

2. Улучшение производительности базы данных

Проверка эффективности является важной характеристикой хранилища данных. В хранилище данных задействована огромная информация, поэтому очень важно использовать продукт модели данных для метаданных и управления данными, которые используются потребителями BI.

Физическая модель добавляет индексирование для оптимизации эффективности базы данных. Схемы также иногда модифицируются. Например, если схема «звезда» обещает более быстрое восстановление данных, она может измениться на схему «снежинки»

3. Предоставляет документацию по исходной и целевой системе.

При разработке системы ETL очень важно проверить физические и логические модели исходной и целевой систем.

Эта документация предлагается путем информационного моделирования в качестве ориентира на будущее.

Концептуальная модель данных

Наивысшая взаимосвязь между различными объектами определяется концептуальной моделью данных.

Это первый шаг к созданию нисходящей модели данных, которая представляет точное представление бизнес-организации.

Разрабатывает общую структуру базы данных и перечисляет предметные области

Содержит виды и взаимодействия сущностей. Символические обозначения (IDEF1X или IE) представляют связь между полями темы. В информационной модели кардинальность показывает отношение один к одному или много

Модель данных отношений

Используется моделирование относительной информации в транзакционно-ориентированных схемах OLTP. Реляционная модель данных имеет существенные особенности:

  • Использование ключа
  • Избыточность данных
  • Связь между данными

Использование ключа

Основным ключом в таблице является ключ. Используется как единая идентификация. Ненулевой столбец является первичным ключом. Для основного ключа используется внешний ключ. Они связывают информацию из одной таблицы в другую таблицу и соединяются.

Избыточность данных

Информационная модель отношений применяет законы целостности информации

Избыточность данных устранена. Часть информации не собирается повторно. Это обеспечивает согласованность данных и ограниченное хранение данных

Связь между данными

Все данные хранятся в таблицах, и каждое отношение имеет столбцы и строки.

Заголовок и тело должны быть на столе. Заголовок - это таблица списка столбцов, а таблица состоит из строк. Кортеж - это единственное значение, которое создается пересечением столбца и строки.

Многомерная модель данных

Организация, которая отражает важные сущности компании и связь между ними, представляет собой логическую перспективу многомерной модели данных. Базы данных и таблицы не ограничены естественной базой данных. Диаграммы ER не изображены.

  • Атрибуты
  • факты
  • измерение

а. измерение

  1. Аспект представляет собой сбор данных, состоящий из отдельных информационных компонентов, которые не перекрываются
  2. Вы можете устанавливать, группировать и фильтровать информацию для просмотра и просмотра конечными пользователями.

б. факты

  1. Таблица столбцов используется для ответа на проблемы компании по численным причинам.
  2. Меры аддитивные, полуаддитивные и неаддитивные

с. Атрибуты

  1. Абстрактные условия предназначены для облегчения обобщения информации в исследовании
  2. Их также можно описать как заголовки столбцов, которые не включены в расчет отчета.

Преимущества Габаритной модели

  1. Стандартизация измерений позволяет легко составлять отчеты по всем направлениям бизнеса.
  2. Размерный также для хранения данных, чтобы облегчить получение данных из данных, когда данные хранятся в базе данных.
  3. Компания очень понятна по размерной модели. Эта модель основана на условиях компании, так что компания понимает смысл каждой реальности, аспекта или функции.
  4. Для быстрого запроса информации размерные модели деформируются и оптимизируются. Многие платформы баз данных отношений признают эту модель и оптимизируют планы производительности запросов.
  5. Габаритные модели могут вместить изменения удобно. Таблицы измерений могут включать дополнительные столбцы, не влияя на использование этих таблиц текущими приложениями компании.

Лучшие практики моделирования данных

Прежде чем приступить к модели данных, необходимо провести полный анализ потребностей компании-клиента. Крайне важно встретиться с клиентами, чтобы обсудить требования и методы информационного моделирования, и чтобы специалисты-субъекты компании немедленно подтвердили это.

Компания должна понимать модель данных, будь то в графическом / метаданном формате или как бизнес-правила для текстов.

Рекомендуемые статьи

Это руководство по моделированию хранилища данных. Здесь мы обсуждаем модель данных, зачем она нужна в хранилище данных, а также ее преимущества и типы моделей. Вы также можете посмотреть следующую статью, чтобы узнать больше -

  1. Инструменты хранилища данных
  2. Типы хранилищ данных
  3. Инструменты анализа данных
  4. Инструменты данных науки
  5. Oracle Data Warehousing