10 вопросов для интервью по основным хранилищам данных (Обновлено на 2019 г.)

Содержание:

Anonim

Введение в хранилище данных Интервью Вопросы и ответы

Что такое хранилище данных?

Хранилище данных - это центральное хранилище, в котором хранятся разнородные данные из разных источников. Данные в хранилище могут использоваться для аналитической отчетности, структурированных или специальных запросов и использоваться при принятии решений. Процесс сбора данных из нескольких источников и их хранения в центральном хранилище называется хранилищем данных.

Данные могут быть нескольких типов, такие как структурированные, полуструктурированные или неструктурированные данные. Данные из различных источников обрабатываются, преобразуются и попадают в одну базу данных, которая называется хранилищем данных. Пользователи могут получить доступ к этим обработанным данным в хранилище данных с помощью различных инструментов, таких как инструменты бизнес-аналитики, клиенты SQL, электронные таблицы и многие другие инструменты. Эти данные помогают выполнять операции интеллектуального анализа данных, которые помогают найти некоторую закономерность в данных.

Теперь, если вы ищете работу, связанную с хранилищем данных, вам нужно подготовиться к вопросам интервью 2019 года по хранилищу данных. Это правда, что каждое собеседование отличается в зависимости от профилей работы. Здесь мы подготовили важные вопросы и ответы для интервью по хранилищу данных, которые помогут вам успешно пройти собеседование.

Теперь давайте разберемся с некоторыми важными вопросами интервью с хранилищем данных 2019 года, которые можно задать во время интервью. Но это не значит, что это единственные вопросы, которые будут заданы в интервью, вы должны быть тщательно подготовлены по каждой теме, которую мы обсуждаем здесь. Эти вопросы делятся на две части:

Часть 1 - вопросы интервью с хранилищем данных (основные)

Эта первая часть охватывает основные вопросы и ответы на вопросы по хранилищу данных.

Q1. Что такое хранилище данных?

Ответ:
Хранилище данных - это процесс сбора данных из различных источников, обработки их и хранения в огромной базе данных, таким образом, обработанные данные могут использоваться для различных целей, таких как аналитическая отчетность, бизнес-аналитика или анализ данных и т. Д. Основная идея хранилища данных - ничто но хранит огромное количество данных.

Q2. Разница между базой данных и хранилищем данных?

Ответ:
Ниже приведены различные таблицы, которые поддерживаются хранилищем данных:

База данных Хранилище данных
Сбор данных, используемых для хранения, доступа и поискаСбор данных, используемых для выполнения аналитики
Ограничено в одном приложенииМожет использоваться несколькими приложениями
Хранит нормализованные данныеДанные не должны быть нормализованы, обычно хранятся как денормализованные данные
ER-ориентированный и ориентированный на приложенияснежинка или начать на основе схемы и предметно-ориентированных
Используется для обработки транзакцийИспользуется для моделирования и анализа данных

Давайте перейдем к следующим вопросам интервью с хранилищем данных

Q3. Каковы этапы хранения данных?

Ответ:
Общие этапы хранилища данных:

  • Автономная операционная база данных: данные копируются из операционной системы на другой сервер для выполнения различных операций.
  • Автономное хранилище данных: данные в хранилище данных регулярно обновляются из оперативной базы данных.
  • Хранилище данных в реальном времени: Хранилище данных обновляется, когда в операционной системе происходит какая-либо транзакция.
  • Интегрированное хранилище данных: хранилище данных постоянно обновляется при выполнении любой транзакции в операционной системе.

Q4. Что такое бизнес-аналитика (BI)?

Ответ:
Это основные вопросы интервью с хранилищем данных, задаваемые в ходе интервью. BI - это технологический процесс для анализа данных и представления конечным пользователям значимых идей, которые помогают принимать более обоснованные решения. BI включает в себя различные инструменты, которые помогают понять тенденции и закономерности данных, скрытые в данных. Некоторые из широко используемых инструментов - SAP Business Intelligence, MicroStrategy, Science, Tableau и многие другие.

Q5. Каковы компоненты хранилища данных?

Ответ:
Четыре компонента хранилища данных:

  • Менеджер нагрузки: выполняет все операции, связанные с извлечением и загрузкой данных в хранилище.
  • Warehouse Manager: выполняет операции, связанные с данными в хранилище. Он выполняет такие операции, как анализ данных, для обеспечения согласованности, создания индексов и представлений и многих других операций.
  • Диспетчер запросов: выполняет все операции, связанные с пользовательскими запросами. Операции этого компонента являются прямыми запросами к соответствующим таблицам.
  • Инструмент доступа конечного пользователя: Инструменты, используемые конечными пользователями для доступа к данным. Он подразделяется на разные группы, такие как
  1. Инструменты отчетности данных
  2. Инструменты запросов
  3. Инструменты разработки приложений
  4. Инструменты EIS
  5. OLAP и инструменты интеллектуального анализа данных

Часть 2 - вопросы интервью с хранилищем данных (продвинутый уровень)

Давайте теперь посмотрим на расширенные вопросы интервью для хранилищ данных.

Q6. Что такое таблица размеров?

Ответ:
Таблица измерений в хранилище данных - это таблица в звездообразной схеме. Таблицы измерений используются для хранения измерений или атрибутов, которые описывают данные в таблице фактов. Например, измерение Product может содержать имя, описание, цену за единицу, вес, цвет и многие другие атрибуты. Система сгенерированного ключа используется для однозначной идентификации строки в таблице измерений. Этот ключ действует как первичный ключ в таблице измерений и используется в качестве внешнего ключа в таблице фактов, которая помогает объединить две таблицы.

Q7. Что такое таблица фактов?

Ответ:
Таблица фактов - это центральная таблица звездообразной схемы, окруженная таблицей измерений хранилища данных. Таблица фактов состоит из количественных метрик или фактов бизнес-процесса. Таблица фактов работает с таблицей измерений и хранит данные, которые должны быть проанализированы. Таблица фактов содержит столбец внешнего ключа, который действует как первичный ключ в таблице измерений, этот ключ позволяет объединять эти две таблицы.

Давайте перейдем к следующим вопросам интервью с хранилищем данных

Q8. Что такое Data Mart?

Ответ:
Data Mart - это подмножество хранилища данных, которое обычно содержит определенный набор данных, связанных с определенной бизнес-линией. Data Mart невелик и используется для запроса или анализа определенного набора данных, например данных, связанных с «продажами», «клиентами», «заказом» и т. Д.

Q9. Что такое оперативное хранилище данных (ODS)?

Ответ:
Это наиболее часто задаваемые вопросы об интервью с хранилищем данных в интервью. ODS - это тип базы данных, в которой хранятся данные, которые используются операционными системами перед сохранением в хранилище данных. Он служит промежуточной базой данных. ODS содержит краткосрочные данные, тогда как хранилище данных содержит исторические данные.

В10. Объясните архитектуру хранилища данных.

Ответ:
Он включает в себя следующие этапы:

  • Уровень источника данных: на этом этапе данные собираются из различных источников и хранятся в реляционной базе данных. Данные включают в себя данные социальных сетей, оперативные данные, данные о транзакциях и многое другое.
  • Уровень подготовки данных: на этом этапе данные из уровня источника данных извлекаются и обрабатываются, поскольку данные будут поступать из различных источников и в разных форматах. Извлеченные данные будут подвергаться проверкам качества, а конечные результаты будут чистыми и упорядоченными данными, которые будут загружены в хранилище данных.
  • Слой хранения данных: этот слой, где данные из промежуточной области будут храниться как единый центральный репозиторий. В зависимости от бизнес-требований хранилищем может быть хранилище данных, витрина данных или операционное хранилище данных.
  • Уровень представления данных: этот уровень используется пользователями для доступа к данным. Пользователи могут выполнять различные запросы или выполнять анализ для выполнения отчетов.

Рекомендуемая статья

Это было руководство к списку вопросов и ответов об интервью с хранилищем данных, чтобы кандидат мог легко разобраться с этими вопросами интервью с хранилищем данных. Здесь, в этом посте, мы изучили основные вопросы интервью с хранилищами данных, которые часто задают в интервью. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. RMAN Интервью Вопросы и ответы
  2. Лучшие 10 вопросов интервью аналитика данных
  3. Наиболее задаваемые вопросы об интервью Hibernate
  4. PowerShell Интервью Вопросы
  5. Полное руководство по хранилищу данных Oracle