Введение в хранилище данных Интервью Вопросы и ответы
Что такое хранилище данных?
Хранилище данных - это центральное хранилище, в котором хранятся разнородные данные из разных источников. Данные в хранилище могут использоваться для аналитической отчетности, структурированных или специальных запросов и использоваться при принятии решений. Процесс сбора данных из нескольких источников и их хранения в центральном хранилище называется хранилищем данных.
Данные могут быть нескольких типов, такие как структурированные, полуструктурированные или неструктурированные данные. Данные из различных источников обрабатываются, преобразуются и попадают в одну базу данных, которая называется хранилищем данных. Пользователи могут получить доступ к этим обработанным данным в хранилище данных с помощью различных инструментов, таких как инструменты бизнес-аналитики, клиенты SQL, электронные таблицы и многие другие инструменты. Эти данные помогают выполнять операции интеллектуального анализа данных, которые помогают найти некоторую закономерность в данных.
Теперь, если вы ищете работу, связанную с хранилищем данных, вам нужно подготовиться к вопросам интервью 2019 года по хранилищу данных. Это правда, что каждое собеседование отличается в зависимости от профилей работы. Здесь мы подготовили важные вопросы и ответы для интервью по хранилищу данных, которые помогут вам успешно пройти собеседование.
Теперь давайте разберемся с некоторыми важными вопросами интервью с хранилищем данных 2019 года, которые можно задать во время интервью. Но это не значит, что это единственные вопросы, которые будут заданы в интервью, вы должны быть тщательно подготовлены по каждой теме, которую мы обсуждаем здесь. Эти вопросы делятся на две части:
Часть 1 - вопросы интервью с хранилищем данных (основные)
Эта первая часть охватывает основные вопросы и ответы на вопросы по хранилищу данных.
Q1. Что такое хранилище данных?
Ответ:
Хранилище данных - это процесс сбора данных из различных источников, обработки их и хранения в огромной базе данных, таким образом, обработанные данные могут использоваться для различных целей, таких как аналитическая отчетность, бизнес-аналитика или анализ данных и т. Д. Основная идея хранилища данных - ничто но хранит огромное количество данных.
Q2. Разница между базой данных и хранилищем данных?
Ответ:
Ниже приведены различные таблицы, которые поддерживаются хранилищем данных:
База данных | Хранилище данных |
Сбор данных, используемых для хранения, доступа и поиска | Сбор данных, используемых для выполнения аналитики |
Ограничено в одном приложении | Может использоваться несколькими приложениями |
Хранит нормализованные данные | Данные не должны быть нормализованы, обычно хранятся как денормализованные данные |
ER-ориентированный и ориентированный на приложения | снежинка или начать на основе схемы и предметно-ориентированных |
Используется для обработки транзакций | Используется для моделирования и анализа данных |
Давайте перейдем к следующим вопросам интервью с хранилищем данных
Q3. Каковы этапы хранения данных?
Ответ:
Общие этапы хранилища данных:
- Автономная операционная база данных: данные копируются из операционной системы на другой сервер для выполнения различных операций.
- Автономное хранилище данных: данные в хранилище данных регулярно обновляются из оперативной базы данных.
- Хранилище данных в реальном времени: Хранилище данных обновляется, когда в операционной системе происходит какая-либо транзакция.
- Интегрированное хранилище данных: хранилище данных постоянно обновляется при выполнении любой транзакции в операционной системе.
Q4. Что такое бизнес-аналитика (BI)?
Ответ:
Это основные вопросы интервью с хранилищем данных, задаваемые в ходе интервью. BI - это технологический процесс для анализа данных и представления конечным пользователям значимых идей, которые помогают принимать более обоснованные решения. BI включает в себя различные инструменты, которые помогают понять тенденции и закономерности данных, скрытые в данных. Некоторые из широко используемых инструментов - SAP Business Intelligence, MicroStrategy, Science, Tableau и многие другие.
Q5. Каковы компоненты хранилища данных?
Ответ:
Четыре компонента хранилища данных:
- Менеджер нагрузки: выполняет все операции, связанные с извлечением и загрузкой данных в хранилище.
- Warehouse Manager: выполняет операции, связанные с данными в хранилище. Он выполняет такие операции, как анализ данных, для обеспечения согласованности, создания индексов и представлений и многих других операций.
- Диспетчер запросов: выполняет все операции, связанные с пользовательскими запросами. Операции этого компонента являются прямыми запросами к соответствующим таблицам.
- Инструмент доступа конечного пользователя: Инструменты, используемые конечными пользователями для доступа к данным. Он подразделяется на разные группы, такие как
- Инструменты отчетности данных
- Инструменты запросов
- Инструменты разработки приложений
- Инструменты EIS
- OLAP и инструменты интеллектуального анализа данных
Часть 2 - вопросы интервью с хранилищем данных (продвинутый уровень)
Давайте теперь посмотрим на расширенные вопросы интервью для хранилищ данных.
Q6. Что такое таблица размеров?
Ответ:
Таблица измерений в хранилище данных - это таблица в звездообразной схеме. Таблицы измерений используются для хранения измерений или атрибутов, которые описывают данные в таблице фактов. Например, измерение Product может содержать имя, описание, цену за единицу, вес, цвет и многие другие атрибуты. Система сгенерированного ключа используется для однозначной идентификации строки в таблице измерений. Этот ключ действует как первичный ключ в таблице измерений и используется в качестве внешнего ключа в таблице фактов, которая помогает объединить две таблицы.
Q7. Что такое таблица фактов?
Ответ:
Таблица фактов - это центральная таблица звездообразной схемы, окруженная таблицей измерений хранилища данных. Таблица фактов состоит из количественных метрик или фактов бизнес-процесса. Таблица фактов работает с таблицей измерений и хранит данные, которые должны быть проанализированы. Таблица фактов содержит столбец внешнего ключа, который действует как первичный ключ в таблице измерений, этот ключ позволяет объединять эти две таблицы.
Давайте перейдем к следующим вопросам интервью с хранилищем данных
Q8. Что такое Data Mart?
Ответ:
Data Mart - это подмножество хранилища данных, которое обычно содержит определенный набор данных, связанных с определенной бизнес-линией. Data Mart невелик и используется для запроса или анализа определенного набора данных, например данных, связанных с «продажами», «клиентами», «заказом» и т. Д.
Q9. Что такое оперативное хранилище данных (ODS)?
Ответ:
Это наиболее часто задаваемые вопросы об интервью с хранилищем данных в интервью. ODS - это тип базы данных, в которой хранятся данные, которые используются операционными системами перед сохранением в хранилище данных. Он служит промежуточной базой данных. ODS содержит краткосрочные данные, тогда как хранилище данных содержит исторические данные.
В10. Объясните архитектуру хранилища данных.
Ответ:
Он включает в себя следующие этапы:
- Уровень источника данных: на этом этапе данные собираются из различных источников и хранятся в реляционной базе данных. Данные включают в себя данные социальных сетей, оперативные данные, данные о транзакциях и многое другое.
- Уровень подготовки данных: на этом этапе данные из уровня источника данных извлекаются и обрабатываются, поскольку данные будут поступать из различных источников и в разных форматах. Извлеченные данные будут подвергаться проверкам качества, а конечные результаты будут чистыми и упорядоченными данными, которые будут загружены в хранилище данных.
- Слой хранения данных: этот слой, где данные из промежуточной области будут храниться как единый центральный репозиторий. В зависимости от бизнес-требований хранилищем может быть хранилище данных, витрина данных или операционное хранилище данных.
- Уровень представления данных: этот уровень используется пользователями для доступа к данным. Пользователи могут выполнять различные запросы или выполнять анализ для выполнения отчетов.
Рекомендуемая статья
Это было руководство к списку вопросов и ответов об интервью с хранилищем данных, чтобы кандидат мог легко разобраться с этими вопросами интервью с хранилищем данных. Здесь, в этом посте, мы изучили основные вопросы интервью с хранилищами данных, которые часто задают в интервью. Вы также можете посмотреть следующие статьи, чтобы узнать больше -
- RMAN Интервью Вопросы и ответы
- Лучшие 10 вопросов интервью аналитика данных
- Наиболее задаваемые вопросы об интервью Hibernate
- PowerShell Интервью Вопросы
- Полное руководство по хранилищу данных Oracle