Введение в Oracle Data Warehousing

Хранилище данных, в общем, может быть определено как база данных для накопления бизнес или организационных данных, на которых могут быть достигнуты желаемые действия бизнес-кейса. Регулярные транзакционные операции отделены от общей рабочей нагрузки, в то время как исторические записи хранятся для анализа, а улучшение выполняется перед складированием. В этой статье мы обсудим хранилище данных Oracle.

Именно хранилище данных включает в себя:

  • Накопление исторических данных из разных источников данных.
  • Проверка и анализ прошлых деловых записей.
  • Получать информацию и необходимую информацию, чтобы стимулировать бизнес-потребности и мотивы.

Таким образом, в основном операции ориентированы на чтение, а не на прямые манипуляции с наборами данных. Хранилище данных Oracle - это полностью оптимизированная облачная, комплексная и надежная концепция базы данных Oracle. Он в первую очередь создан для эффективной и гибкой работы с базами данных, что делает его лучшим на рынке.

Характеристики хранилища данных

Американский ученый-компьютерщик Уильям Х. Инмон называет характеристики хранилища данных:

  • Предметно-ориентированная

Хранилище данных в первую очередь построено для анализа данных и получения информации. Мы можем на заказ построить склады в определенных отделах фирмы.

которые, в свою очередь, могут выводить лидеров списка лидеров, целевых клиентов и т. д.

  • интегрированный

Данные, которыми манипулируют, часто выбираются из разных источников. В таких обстоятельствах данные должны преобладать в последовательном предотвращении конфликтов. Такая приобретенная черта - целостность.

  • Нелетучий

Когда данные передаются в хранилище, ими нельзя манипулировать или изменять. Так как анализ сделан на данных, которые произошли.

  • Время-Variant

Для определения тенденций и регрессии на исторических данных аналитику требуется огромный объем данных.

Архитектура Oracle Data Warehousing

В целом, архитектура хранилища данных Oracle может быть в целом распределена по следующим категориям:

1. Одноуровневая архитектура

Основная цель заключается в значительном сокращении объема хранения данных, что устраняет избыточность. Но на практике это очень редко используется.

2. Двухуровневая архитектура

Дискретный уровень физически доступных источников данных и хранилищ данных. Сравнительно архитектура не является расширяемой, а также сталкивается с ограничениями подключения.

3. Трехуровневая архитектура

Знаменитая архитектура состоит из нижнего, среднего и верхнего яруса.

  • Нижний уровень: база данных принадлежит этому слою, который в основном представляет собой реляционные системы баз данных. Ресурсы данных собираются и обрабатываются с использованием различных серверных приложений и передаются в базу данных.
  • Средний уровень: абстрактное многоуровневое представление базы данных, которое выступает в качестве промежуточного звена между пользователем и базой данных. Oracle поддерживает мощный OLAP, который реализован на промежуточном уровне, обеспечивая безопасные, масштабируемые аналитические меры в системе.
  • Верхний уровень: интерфейсный уровень выбирает данные из базы данных и представляет их клиенту. Это может быть любой из инструментов запросов на основе Oracle, например SQLPlus, разработчик SQL.

Теперь мы будем двигаться вперед, исследуя детали общей архитектуры. Обратитесь к изображению ниже:

  • Прежде всего, центральная система, т.е. хранилище данных Oracle, состоит из необработанных данных, метаданных и сводных данных.
  • Необработанные данные представляют собой фактическую полезную нагрузку обычного хранимого OLTP, вместе с которым метаданные определяют данные, присутствующие в них.
  • С другой стороны, в сводных данных содержатся все избыточные дорогостоящие и длительные операции, которые также называются материализованным представлением.
  • Обеспечение правильного качества источника данных является более важным, что, в свою очередь, влияет на качество и обслуживание хранилищ данных в долгосрочной перспективе.

Источники данных

  • На крупных предприятиях данные часто выбираются из разных каналов.
  • Это может быть где угодно, начиная от устаревших данных, внешних источников, вертикальных приложений.

Плацдарм

  • Предполагается, что операционные данные обрабатываются и очищаются перед отправкой в ​​хранилище данных.
  • Промежуточная область заботится об этом процессе, который снова может быть запущен программно.
  • Промежуточная область отвечает за консолидацию и обработку неструктурированных данных из различных источников данных.
  • Значение промежуточной области может быть реализовано при обработке хранилищ на уровне предприятия, где данные должны поступать коллективно в неструктурированном формате, обрабатываться и консолидироваться до подачи в хранилище.

Витрины данных

  • Помимо обработки источников данных, корпоративной фирме часто требуется настраивать область архитектуры для различных групп.
  • Витрины данных служат такой цели, когда система, зависящая от различных отделов, таких как маркетинг, инвентаризация специально предназначена для использования по назначению. Витрины данных определяют область доступности пользователей и групп пользователей и управляют превентивными способами.
  • Например, группа по составлению отчетов получит доступ к данным о продажах и информационной панели процессов для бизнеса, тогда как отдел продаж использует данные из группы аналитиков для принятия бизнес-решений. Такая консолидация и определение области объявляются в витринах данных.
  • Кроме того, витрины данных обычно могут быть совмещены с системой хранилища данных Oracle, а иногда могут создаваться как отдельная система, способствующая масштабированию.

преимущества

  • Для сравнения, хранилище Oracle считается простым и легко настраиваемым, если цели и источники понятны.
  • В первую очередь стремится импровизировать принятия решений в бизнесе.
  • Повышенная производительность и эффективные эксплуатационные расходы.
  • Поддерживает преобразование больших необработанных данных в ценные идеи.
  • Целостность данных может быть гарантирована с быстрым качеством.

Недостатки

Несмотря на все похвалы, хранилище данных Oracle имеет определенные недостатки, как описано ниже:

  • Проблемы безопасности

Безопасность данных может быть точно учтена только в качестве гарантии поставщика. Также, если это внутренняя реализация, обеспечение надежной области доступности для различных потоков в компании может быть затруднено.

  • Гибкость данных

Часто склады, как правило, содержат статические данные и подвержены серьезным структурам запросов.

  • Соотношение цена / качество

Обслуживание и затраты ИТ-персонала являются огромным фактором при внедрении хранилища данных Oracle.

Управление качеством в Oracle Data Warehousing

  • Поддержка сквозных качественных решений.
  • Отслеживает метаданные и сводку хранилища.
  • В зависимости от потребностей это может порождать отображение для исправления данных.

Роли хранилища данных в фирме могут быть конкретно классифицированы как различные должности, начиная от Data Miner, консультанта / разработчика хранилища данных до архитектора. В ИТ-отрасли постоянно наблюдается быстрый рост специализаций в области хранилищ данных в технологиях бизнес-аналитики.

Рекомендуемые статьи

Это руководство по Oracle Data Warehousing. Здесь мы обсудим архитектуру, характеристики, преимущества и недостатки хранилища данных Oracle. Вы также можете просмотреть наши другие предлагаемые статьи -

  1. Компоненты Oracle Warehouse Builder
  2. Что такое база данных Oracle и ее архитектура
  3. Введение в строковые функции Oracle
  4. Простые шаги по установке Oracle
  5. KPI в Power BI
  6. Power BI IF Заявление
  7. Что такое запрос и типы запросов Oracle