Хранилище данных против Data Mart - Топ 8 отличий с инфографикой.

Содержание:

Anonim

Разница между хранилищем данных и хранилищем данных

Хранилище данных - это центральное хранилище, поддерживаемое организациями, в которое интегрированы данные из различных источников, чтобы предоставить ценную информацию о бизнесе. Он поддерживается отдельно от оперативной базы данных организации, которая предназначена для запросов и анализа, а не для обработки транзакций. Это предметно-ориентированный, интегрированный, энергонезависимый и изменяющийся во времени. Это интегрированный и стабильный источник информации, предоставляющий информацию о различных предметах, где данные согласованы независимо от времени доступа к хранилищу. Хранилище данных постоянно развивается, поскольку оно не является статичной структурой. Data Mart - это подмножество Data Warehouse, поддерживаемое организациями для определенной группы пользователей, которая оптимизирована для доступа. Он более гибкий, так как получает данные из меньшего количества источников по сравнению с хранилищем данных. Размер Data Mart меньше по сравнению с большим размером хранилища данных, и он предназначен для облегчения анализа данных конечным пользователем и поддерживает одно аналитическое приложение, используемое отдельным набором пользователей. На основе источников данных витрины данных делятся на две категории: зависимые и независимые витрины данных. Витрины данных реализованы на недорогих серверах для ведомственного использования.

Сравнение между хранилищем данных и Data Mart (инфографика)

Ниже представлено 8 лучших отличий между хранилищем данных и хранилищем данных.

Ключевые отличия Хранилище данных от Data Mart

Давайте обсудим некоторые основные различия между хранилищем данных и хранилищем данных:

  • Одно из ключевых отличий Data Warehouse от Data Mart заключается в том, что Data Warehouse является центральным хранилищем данных, которое служит цели принятия решений, тогда как Data Mart является логическим подмножеством Data Warehouse, используемым для конкретных пользователей.
  • Хранилище данных подвержено риску сбоя из-за его очень большого размера и интеграции из различных источников. С другой стороны, Data Mart имеет меньший риск сбоя из-за его меньшего размера и интеграции данных из меньшего количества источников.
  • Хранилище данных обеспечивает общеорганизационное представление для своей централизованной системы и является независимым, тогда как Data Mart предоставляет представление о подразделениях и децентрализованное хранилище, так как является подмножеством хранилища данных.
  • Хранилище данных ориентировано на приложения, тогда как Data Mart используется для системы поддержки принятия решений.
  • Data Mart хранит обобщенные данные, в то время как хранилище данных хранит данные в подробном виде. Данные находятся в сильно ненормализованной форме в Data Mart, тогда как в хранилище данных данные слегка ненормализованы.
  • Данные хранятся в едином, интегрированном и централизованном хранилище в хранилище данных, тогда как в хранилище данных данные хранятся на недорогих серверах для использования в определенных отделах.
  • При построении хранилища данных используется нисходящий подход, а при построении Data Mart - восходящий.
  • Хранилище данных - это предметно-ориентированный временной вариант, который существует более длительное время, тогда как Data Mart предназначен для конкретных областей, связанных с организацией, и существует в течение более короткого времени.
  • Схема «звезда» используется при моделировании Data Mart, тогда как схема констелляции фактов используется для моделирования хранилища данных. Обычно схема констелляции фактов включает в себя широкий спектр предметных областей, с другой стороны, схема Star используется для подхода к моделированию одного субъекта в витринах данных.

Хранилище данных и таблица сравнения данных Mart

Давайте посмотрим на 8 лучших Сравнение хранилища данных и Data Mart

СКЛАД ДАННЫХ

ДАТА МАРТА

Хранилище данных хранит данные из нескольких предметных областей.Data Mart содержит данные, относящиеся к определенной области, такой как финансы, HR, продажи и т. Д.
Это центральное хранилище данных в организации.Это подмножество хранилища данных.
Данные интегрированы в хранилище данных как одно хранилище из различных источников.Данные интегрированы в Data Mart из меньшего количества источников, чем хранилище данных.
Хранилище данных обычно моделируется из схемы констелляции фактов.Data Mart разработан для пространственной модели с использованием звездообразной схемы.
Сложно спроектировать и использовать хранилище данных, поскольку его размер может превышать 100 гигабайт.Проектирование и использование Data Mart сравнительно проще из-за гибкости его небольшого размера.
Хранилище данных предназначено для принятия решений в организации.Data Mart предназначен для конкретных групп пользователей или отделов.
Это следует нисходящему подходу.Это следует восходящему подходу.
Хранилище данных содержит меньше ненормализованных данных, чем Data Mart.Data Mart хранит сильно нормализованные данные.

Вывод

Хранилище данных предоставляет пользователю единый интегрированный интерфейс, в котором можно легко выполнять запросы поддержки принятия решений, а хранилище данных обеспечивает представление и хранение в подразделениях. Хранилище данных сложно построить из-за его большого размера, тогда как хранилище данных проще поддерживать и создавать для его меньшего размера, характерного для определенных предметных областей. Организации могут работать над своими требованиями по настройке витрин данных для разных отделов и, соответственно, объединять их для создания хранилища данных или сначала могут создать хранилище данных, а затем, по мере необходимости, могут создать несколько витрин данных для конкретных отделов. Но из-за определенных ограничений, таких как время и стоимость, организации обычно сначала строят витрины данных, а затем объединяют их для создания хранилища данных. Технология облачных вычислений дала преимущество в сокращении времени и затрат для эффективного создания хранилища данных в масштабах всего предприятия. Кроме того, поскольку оба хранилища данных и хранилище данных содержат ненормализованные данные, нам необходимо найти решения для повышения производительности запросов. Извлечение, преобразование и загрузка или ETL - это такая концепция, которая позволяет извлекать данные из нескольких источников, затем преобразовывать данные в соответствии с требованиями бизнеса и, наконец, загружать данные в систему.

Рекомендуемые статьи

Это было руководство к разнице между хранилищем данных и Data Mart. Здесь мы также обсудим основные различия между хранилищем данных и базой данных с помощью инфографики и таблицы сравнения. Вы также можете взглянуть на следующие статьи, чтобы узнать больше

  1. Данные против информации - главное различие
  2. Хранилище данных против Hadoop
  3. Разница между большими данными и хранилищем данных