Введение в ETL Интервью Вопросы и ответы

ETL расшифровывается как Extract-Transform-Load. Это системная основа хранилища данных, где данные извлекаются из различных источников, а затем данные преобразуются, где данные применяются или обрабатываются, чтобы обеспечить качество, согласованность данных в соответствующем формате представления, а затем, наконец, данные загружаются в хранилище данных в формате презентации, что позволяет конечному пользователю легко получить информацию и принять решение.

Ниже приведены лучшие вопросы интервью ETL 2019 года, которые часто задают в интервью.

Если вы ищете работу, связанную с ETL, вам необходимо подготовиться к вопросам интервью ETL 2019 года. Хотя каждое интервью отличается и объем работы также различен, мы можем помочь вам с лучшими вопросами и ответами об интервью ETL, которые помогут вам сделать скачок и добиться успеха в своем интервью.

Часть 1 - ETL Интервью Вопросы (Основной)

Эта первая часть охватывает основные вопросы и ответы ETL Интервью

1. Развернуть систему ETL в хранилище данных? объяснять

Ответ:
Система Extract-Transform-Load (ETL) является основой хранилища данных. Правильно спроектированная система ETL извлекает данные из исходных систем, обеспечивает соблюдение стандартов качества и согласованности данных, подтверждает данные, так что отдельные источники могут использоваться вместе, и, наконец, доставляет данные в готовом для представления формате, чтобы разработчики приложений могли создавать приложения и конечных пользователей. может принимать решения.

2. Значение системы ETL в хранилище данных?

Ответ :
Удаляет ошибки и исправляет недостающие данные. Он обеспечивает документированные меры доверия к данным. Захватывает поток транснациональных данных для безопасного хранения. Настраивает данные из нескольких источников для совместного использования. Структурирует данные для использования инструментами конечного пользователя.

3. Каков ежедневный процесс в Системе ETL?

Ответ :
Создайте набор разработки / тестирования / производства процессов ETL. Понимание компромиссов различных структур данных бэк-рума, включая плоские файлы, нормализованные схемы, схемы XML и схемы со звездообразным соединением (размерные). Анализировать и извлекать исходные данные. Создать комплексную подсистему очистки данных. Структурируйте данные в многомерные схемы для наиболее эффективной доставки конечным пользователям, инструментам бизнес-аналитики, инструментам интеллектуального анализа данных, кубам OLAP и аналитическим приложениям. Эффективно доставляйте данные как в централизованные, так и в глубоко распределенные хранилища данных, используя те же методы. Настройте общий процесс ETL для оптимальной производительности.

Давайте перейдем к следующим вопросам интервью ETL.

4. Форматы данных в системе ETL?

Ответ :
В ETL существуют различные форматы данных, некоторые из которых представляют собой плоские файлы, наборы данных XML, независимые рабочие таблицы СУБД, схемы нормализованных сущностей / отношений (E / R) и модели размерных данных.

5. Профилирование данных в системе ETL?

Ответ :
Профилирование данных - это систематическое исследование качества, объема и контекста источника данных, позволяющее построить систему ETL. С одной стороны, очень чистый источник данных, который был в хорошем состоянии, прежде чем он попадет в хранилище данных, требует минимального преобразования и вмешательства человека для загрузки непосредственно в окончательные таблицы измерений и таблицы фактов.

6. Что такое валидатор ETL?

Ответ :
ETL Validator - это инструмент тестирования данных, который значительно упрощает тестирование проектов по интеграции данных, хранилищу данных и миграции данных. Он использует нашу запатентованную архитектуру ELV для извлечения, загрузки и проверки данных из источников данных, таких как базы данных, плоские файлы, системы XML, Hadoop и BI.

Часть 2 - вопросы интервью ETL (продвинутый)

Давайте теперь посмотрим на расширенные вопросы интервью ETL.

7. Каковы операции в системе ETL?

Ответ :
Следующие три операции: извлекают данные из вашей транснациональной системы, которая может быть Oracle, Microsoft или любой другой реляционной базы данных, преобразуют данные, выполняя операции очистки данных. Загрузка - это процесс записи данных в целевую базу данных.

8. Назовите некоторые из инструментов ETL, наиболее часто используемых на рынке?

Ответ:
На рынке используются различные инструменты ETL, но некоторые из наиболее популярных инструментов ETL
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• Информационный сервер IBM Infosphere.
• Управление данными SAS.
• Энергетический центр Informatica.
• Elixir Repertoire для данных ETL.
• Data Migrator (IBI)
• Службы интеграции SQL Server (SSIS)

9. Каковы роли и обязанности команды ETL?

Ответ:
Роль команды ETL на высшем уровне заключается в создании задней комнаты хранилища данных.
• Наиболее эффективно доставлять данные в инструменты конечного пользователя.
• Добавьте ценность к данным на этапах очистки и соответствия
• Защищать и документировать происхождение данных
• Извлечение данных из первоисточников
• Обеспечение качества и очистка данных
• Соответствие меткам и мерам в данных для достижения
• согласованность между первоисточниками
• Доставка данных в физическом формате, который может использоваться инструментами запросов,
• Авторы отчетов и информационные панели.

Давайте перейдем к следующим вопросам интервью ETL.

10. Какова роль анализа воздействия в системе ETL?

Ответ:
Анализ воздействия анализирует метаданные, связанные с объектом (в данном случае это таблица или столбец), и определяет, на что влияет изменение его структуры или содержимого. Изменение объектов размещения данных может нарушить процессы, которые имеют решающее значение для правильной загрузки хранилища данных. Разрешение специальных изменений в промежуточных объектах данных наносит ущерб успеху вашего проекта. После того, как таблица создана в промежуточной области, вы должны выполнить анализ воздействия, прежде чем вносить в него какие-либо изменения. Многие поставщики инструментов ETL предоставляют функциональность анализа воздействия, но эта функциональность часто упускается из виду во время проверки концепции продукта ETL, потому что это вспомогательная функция и
Не очень важно, пока хранилище данных не заработало и не начало развиваться.

11. Как вы обрабатываете плоский файл фиксированной длины?

Ответ:
Формат файла фиксированной длины должен включать имя файла, с которого начинается поле; его длина; и его тип данных (обычно текст или число). Иногда конечная позиция предоставляется. Если это не так, вы должны рассчитать конечную позицию каждого поля на основе его начальной позиции и длины, если этого требует ваш инструмент ETL. В большинстве инструментов ETL вам, скорее всего, придется вручную вводить формат файла плоского файла один раз. После ввода макета инструмент запоминает макет и ожидает тот же макет при каждом взаимодействии с реальным плоским файлом. Если формат файла изменяется или данные смещаются с назначенных им позиций, процесс ETL должен быть запрограммирован на неудачу. При обработке плоских файлов фиксированной длины попытайтесь проверить правильность положения данных в файле. Быстрая проверка для подтверждения позиций заключается в проверке любого поля даты (или времени), чтобы убедиться, что оно является действительной датой. Если позиции смещены, поле даты, скорее всего, содержит буквенные символы или нелогичные числа. Другие поля с очень конкретными доменами могут быть проверены таким же образом. XML предлагает более конкретные возможности проверки. Если проблема заключается в проверке или согласованности данных, попытайтесь убедить поставщика данных доставить данные в формате XML.

12. Почему в реальном времени ETL в хранилище данных?

Ответ:
Хранилище данных должно было предоставлять непоколебимый набор данных лицам, принимающим бизнес-решения, обеспечивая надежную информационную базу, на которой можно было бы стоять. Для получения актуальных отчетов по мерцающей базе данных бизнес-пользователи были направлены на производственные приложения, управляющие бизнесом. Поэтому пользователям приходилось обращаться к хранилищу данных, чтобы получить историческую картину того, что произошло в бизнесе на вчерашний день, и им пришлось просматривать многие OLTP-системы, чтобы увидеть картину того, что происходит сегодня. Бизнес-пользователи никогда полностью не принимали это разделение. Хранилищам данных, разумеется, абсолютно необходимы постоянные потоки информации о клиентах в процессе эксплуатации, но все более оперативные системы также полагаются на обогащение хранилища данных о клиентах. Таким образом, предсказуемо, что организации начали исследовать архитектурные альтернативы, которые могут поддерживать более обобщенные сценарии интеграции, перемещая операционные данные между приложениями и одновременно в и из хранилища с постоянно растущей срочностью.

Рекомендуемые статьи

Это было руководство к Списку Вопросов Интервью ETL и Ответов, чтобы кандидат мог легко разобраться в этих Вопросах Интервью ETL. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Лазурный Паас против Яаса - Особенности
  2. 9 Amazing MapReduce Интервью Вопросы и ответы
  3. Топ 11 самых полезных вопросов и ответов по интервью с РСУБД
  4. 10 самых удивительных вопросов об интервью PHP для опытных
  5. Знайте Топ 5 полезных вопросов и ответов DBA интервью

Категория: