Что такое Data Mart? - Типы, функции и шаги для реализации Data Mart

Содержание:

Anonim

Введение в Data Mart

Мир становится все более цифровым, и каждая организация генерирует несколько петабайт данных. Data Mart - это одна из таких классификаций данных из хранилища данных, где концентрация сосредоточена на одном предмете.

Можно сказать, что это данные, относящиеся к одному конкретному отделу или категории, например, к продажам, финансам или маркетингу и т. Д. В основном это подмножество хранилищ данных. Поскольку существует концентрация на конкретных предметах или отделах, мы можем сказать, что источник этого ограничен или зависит от очень немногих источников.

Data Mart против хранилища данных

Хранилище данных - это хранилище с набором данных из нескольких потоков субъекта. Часть обслуживания и контроля, такая как сбор необработанных данных и их обработка, в основном осуществляется ИТ-отделами корпоративных информационных технологий, которые предоставляют различные услуги родительским организациям.

Хранилище данных также называется центральным или корпоративным хранилищем данных. Таким образом, источник в хранилище данных будет множественным, в отличие от витрины данных, которая в некоторых случаях является подмножеством хранилища данных.

Типы Data Mart

Обычно существует три типа витрин данных. Они есть:

1. Зависимое хранилище данных

Зависимая витрина данных является чисто хранилищем данных, и все сгруппированные зависимые образуют корпоративное хранилище данных. Это чисто подмножество хранилища данных, так как оно создается из центральной DW.

Поскольку чистые и обобщенные данные уже присутствуют в процессе ETT центрального хранилища данных или упрощено извлечение и преобразование. Нам просто нужно определить конкретное подмножество и выполнить ETT поверх него.

Эти витрины данных, как правило, создаются для обеспечения большей доступности и большей производительности с улучшенным контролем и эффективностью.

2. Независимый Data Mart

Это не создается из центрального хранилища данных, и источник этого может быть другим. Поскольку данные поступают не из центрального DW ETT, процесс немного отличается.

Большая часть независимой витрины данных используется небольшой группой организаций, и источник этого также ограничен. Независимая витрина данных обычно создается, когда нам нужно получить решение в относительно короткие сроки.

3. Гибридный Data Mart

Гибридная витрина данных позволит вам группировать данные из всех других источников, кроме центрального хранилища данных DW. Когда мы имеем дело со специальной интеграцией, это значительно выиграет от работы над всеми продуктами, которые были добавлены в организации извне.

Особенности Data Mart

Ниже приведены некоторые особенности витрины данных:

  • Поскольку источник данных сконцентрирован на субъекте, время отклика пользователя увеличивается с его использованием.
  • Для часто запрашиваемых данных будет полезно использовать витрины данных, поскольку они имеют подмножество для центрального DW и, следовательно, размер данных будет меньше.
  • Кроме того, поскольку объем данных ограничен, время обработки будет значительно сокращено по сравнению с центральными Dws.
  • Они в основном гибкие и могут достаточно быстро и эффективно учесть изменения в модели по сравнению с хранилищем данных.
  • Для Datamart требуется один специалист по предметам, который, в отличие от данных хранилища, должен обладать знаниями, необходимыми нам для нескольких тематических складов. Из-за этого мы говорим, что витрина данных более гибкая.
  • Мы можем разделить категории доступа на низком уровне с разделенными данными и с витриной данных, это очень легко.
  • Зависимость инфраструктуры довольно ограничена, и данные могут храниться на разных аппаратных платформах после сегментации.

Шаги для реализации Data Mart

Ниже приведены шаги, которые необходимы для его реализации.

1. Проектирование

Это будет первый шаг в реализации, где будут определены все необходимые задачи и источники для сбора технической и деловой информации. Позже логический план будет реализован и после проверки будет преобразован в физический план. Кроме того, здесь определяется логическая и физическая структура данных, например, как разделить данные и поле раздела, например дата или любой другой файл.

2. Строительство

Это второй этап внедрения, когда физические базы данных были созданы с помощью СУБД, которая была определена как часть процесса проектирования и логических структур. Все объекты, такие как схема, индексы, таблицы, представления и т. Д. Созданы.

3. Население

Это третья фаза, и здесь данные заполняются при ее получении. Все необходимые преобразования выполняются до заполнения данных на нем.

4. Доступ

Это следующий шаг реализации, где мы будем использовать заполненные данные для запроса при создании отчетов. Конечный пользователь использует этот шаг для понимания данных с помощью запросов.

5. Управление

Это последний этап реализации витрины данных, и здесь решаются различные задачи, такие как управление доступом, оптимизация и настройка системы, управление и добавление свежих данных в витрину данных и планирование сценариев восстановления для обработки любых случаев отказа.

Преимущества Data Mart

Ниже приведены некоторые преимущества его использования.

  • Это одна из лучших экономически эффективных альтернатив хранилищу данных, где вам нужно работать только с небольшим сегментом данных.
  • Отделение данных от источников сделает витрину данных эффективной, поскольку определенная группа людей может обрабатывать данные из определенного источника, а не с использованием хранилища данных.
  • Более быстрый доступ к данным возможен при использовании витрины данных, если мы знаем, к какому подмножеству мы должны получить доступ.
  • Datamart намного проще в использовании, поэтому конечные пользователи могут легко делать запросы поверх них.
  • Переход к времени реализации данных требует меньше времени по сравнению с хранилищем данных, поскольку данные разделены по группам.
  • Исторические данные от определенного предмета могут использоваться для легкого анализа тренда.

Вывод

Поскольку он сосредоточен на одной функциональной области, существует множество преимуществ как для разработчика процесса, так и для конечного пользователя. Следовательно, требуется эффективное внедрение витрин вместе с хранилищем данных в организации.

Рекомендуемые статьи

Это руководство к Что такое Data Mart. Здесь мы обсуждаем введение, функции и топ-3 типа, а также его функции и этапы. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Oracle Data Warehousing
  2. Типы данных R
  3. Типы данных Python
  4. Cassandra Data Modeling
  5. Полное руководство по модели данных в Кассандре