Введение в Oracle Data Warehousing
Хранилище данных, в общем, может быть определено как база данных для накопления бизнес или организационных данных, на которых могут быть достигнуты желаемые действия бизнес-кейса. Регулярные транзакционные операции отделены от общей рабочей нагрузки, в то время как исторические записи хранятся для анализа, а улучшение выполняется перед складированием. В этой статье мы обсудим хранилище данных Oracle.
Именно хранилище данных включает в себя:
- Накопление исторических данных из разных источников данных.
- Проверка и анализ прошлых деловых записей.
- Получать информацию и необходимую информацию, чтобы стимулировать бизнес-потребности и мотивы.
Таким образом, в основном операции ориентированы на чтение, а не на прямые манипуляции с наборами данных. Хранилище данных Oracle - это полностью оптимизированная облачная, комплексная и надежная концепция базы данных Oracle. Он в первую очередь создан для эффективной и гибкой работы с базами данных, что делает его лучшим на рынке.
Характеристики хранилища данных
Американский ученый-компьютерщик Уильям Х. Инмон называет характеристики хранилища данных:
-
Предметно-ориентированная
Хранилище данных в первую очередь построено для анализа данных и получения информации. Мы можем на заказ построить склады в определенных отделах фирмы.
которые, в свою очередь, могут выводить лидеров списка лидеров, целевых клиентов и т. д.
-
интегрированный
Данные, которыми манипулируют, часто выбираются из разных источников. В таких обстоятельствах данные должны преобладать в последовательном предотвращении конфликтов. Такая приобретенная черта - целостность.
-
Нелетучий
Когда данные передаются в хранилище, ими нельзя манипулировать или изменять. Так как анализ сделан на данных, которые произошли.
-
Время-Variant
Для определения тенденций и регрессии на исторических данных аналитику требуется огромный объем данных.
Архитектура Oracle Data Warehousing
В целом, архитектура хранилища данных Oracle может быть в целом распределена по следующим категориям:
1. Одноуровневая архитектура
Основная цель заключается в значительном сокращении объема хранения данных, что устраняет избыточность. Но на практике это очень редко используется.
2. Двухуровневая архитектура
Дискретный уровень физически доступных источников данных и хранилищ данных. Сравнительно архитектура не является расширяемой, а также сталкивается с ограничениями подключения.
3. Трехуровневая архитектура
Знаменитая архитектура состоит из нижнего, среднего и верхнего яруса.
- Нижний уровень: база данных принадлежит этому слою, который в основном представляет собой реляционные системы баз данных. Ресурсы данных собираются и обрабатываются с использованием различных серверных приложений и передаются в базу данных.
- Средний уровень: абстрактное многоуровневое представление базы данных, которое выступает в качестве промежуточного звена между пользователем и базой данных. Oracle поддерживает мощный OLAP, который реализован на промежуточном уровне, обеспечивая безопасные, масштабируемые аналитические меры в системе.
- Верхний уровень: интерфейсный уровень выбирает данные из базы данных и представляет их клиенту. Это может быть любой из инструментов запросов на основе Oracle, например SQLPlus, разработчик SQL.
Теперь мы будем двигаться вперед, исследуя детали общей архитектуры. Обратитесь к изображению ниже:
- Прежде всего, центральная система, т.е. хранилище данных Oracle, состоит из необработанных данных, метаданных и сводных данных.
- Необработанные данные представляют собой фактическую полезную нагрузку обычного хранимого OLTP, вместе с которым метаданные определяют данные, присутствующие в них.
- С другой стороны, в сводных данных содержатся все избыточные дорогостоящие и длительные операции, которые также называются материализованным представлением.
- Обеспечение правильного качества источника данных является более важным, что, в свою очередь, влияет на качество и обслуживание хранилищ данных в долгосрочной перспективе.
Источники данных
- На крупных предприятиях данные часто выбираются из разных каналов.
- Это может быть где угодно, начиная от устаревших данных, внешних источников, вертикальных приложений.
Плацдарм
- Предполагается, что операционные данные обрабатываются и очищаются перед отправкой в хранилище данных.
- Промежуточная область заботится об этом процессе, который снова может быть запущен программно.
- Промежуточная область отвечает за консолидацию и обработку неструктурированных данных из различных источников данных.
- Значение промежуточной области может быть реализовано при обработке хранилищ на уровне предприятия, где данные должны поступать коллективно в неструктурированном формате, обрабатываться и консолидироваться до подачи в хранилище.
Витрины данных
- Помимо обработки источников данных, корпоративной фирме часто требуется настраивать область архитектуры для различных групп.
- Витрины данных служат такой цели, когда система, зависящая от различных отделов, таких как маркетинг, инвентаризация специально предназначена для использования по назначению. Витрины данных определяют область доступности пользователей и групп пользователей и управляют превентивными способами.
- Например, группа по составлению отчетов получит доступ к данным о продажах и информационной панели процессов для бизнеса, тогда как отдел продаж использует данные из группы аналитиков для принятия бизнес-решений. Такая консолидация и определение области объявляются в витринах данных.
- Кроме того, витрины данных обычно могут быть совмещены с системой хранилища данных Oracle, а иногда могут создаваться как отдельная система, способствующая масштабированию.
преимущества
- Для сравнения, хранилище Oracle считается простым и легко настраиваемым, если цели и источники понятны.
- В первую очередь стремится импровизировать принятия решений в бизнесе.
- Повышенная производительность и эффективные эксплуатационные расходы.
- Поддерживает преобразование больших необработанных данных в ценные идеи.
- Целостность данных может быть гарантирована с быстрым качеством.
Недостатки
Несмотря на все похвалы, хранилище данных Oracle имеет определенные недостатки, как описано ниже:
-
Проблемы безопасности
Безопасность данных может быть точно учтена только в качестве гарантии поставщика. Также, если это внутренняя реализация, обеспечение надежной области доступности для различных потоков в компании может быть затруднено.
-
Гибкость данных
Часто склады, как правило, содержат статические данные и подвержены серьезным структурам запросов.
-
Соотношение цена / качество
Обслуживание и затраты ИТ-персонала являются огромным фактором при внедрении хранилища данных Oracle.
Управление качеством в Oracle Data Warehousing
- Поддержка сквозных качественных решений.
- Отслеживает метаданные и сводку хранилища.
- В зависимости от потребностей это может порождать отображение для исправления данных.
Роли хранилища данных в фирме могут быть конкретно классифицированы как различные должности, начиная от Data Miner, консультанта / разработчика хранилища данных до архитектора. В ИТ-отрасли постоянно наблюдается быстрый рост специализаций в области хранилищ данных в технологиях бизнес-аналитики.
Рекомендуемые статьи
Это руководство по Oracle Data Warehousing. Здесь мы обсудим архитектуру, характеристики, преимущества и недостатки хранилища данных Oracle. Вы также можете просмотреть наши другие предлагаемые статьи -
- Компоненты Oracle Warehouse Builder
- Что такое база данных Oracle и ее архитектура
- Введение в строковые функции Oracle
- Простые шаги по установке Oracle
- KPI в Power BI
- Power BI IF Заявление
- Что такое запрос и типы запросов Oracle