Введение в Hbase Интервью Вопросы и ответы

HBase - это популярная ориентированная на столбцы система управления базами данных NoSQL, которая работает поверх распределенной файловой системы Hadoop (HDFS). Он хорошо подходит для разреженных наборов данных, которые распространены во многих случаях использования больших данных.

Вот 10 самых часто задаваемых вопросов и ответов на интервью HBase 2019 года: Итак, вы, наконец, нашли работу своей мечты в HBase, но задаетесь вопросом, как взломать интервью Hbase и какие могут быть вероятные вопросы интервью Hbase 2019 года. Каждое собеседование отличается и объем работы также отличается. Помня об этом, мы разработали самые распространенные вопросы и ответы Hbase для интервью, чтобы помочь вам добиться успеха на собеседовании. Эти вопросы делятся на две части:

Часть 1 - HBase Интервью Вопросы (Базовый)

Эта первая часть охватывает основные вопросы и ответы HBase Interview.

1. Когда вы должны использовать HBase?

Ответ:
Hbase подходит не для всех случаев использования. Наиболее подходящий сценарий можно определить с помощью следующих проверок:
Объем i.Data: должен иметь петабайты данных для обработки в распределенной среде.
ii.Применение: HBase не подходит для систем OLTP (Online Transaction Processing), которые требуют сложных транзакций из нескольких операторов. Также не хватает сложной поддержки SQL, которая требуется для реляционной аналитики. Это предпочтительно, когда у вас есть большой объем данных с немного другая схема.
iii.Кластерное оборудование: HBase работает поверх HDFS. А HDFS эффективно работает с большим количеством узлов (минимум 5). Поэтому HBase может быть хорошим выбором только с хорошей аппаратной поддержкой.
iv.Не традиционные СУБД: Hbase не может поддерживать ни один вариант использования, для которого требуются традиционные функции, такие как объединение нескольких таблиц, сложные SQls с вложенными или оконными функциями и т. д.
v.Быстрый произвольный доступ к данным: если вам нужен произвольный доступ к вашим данным в реальном времени, то HBase - подходящий кандидат. Он также идеально подходит для хранения больших таблиц с многоструктурными данными.

2. В чем разница между Кассандрой и HBase?

Ответ:
И HBase, и Cassandra распространили базу данных NoSQL для больших данных из экосистемы Hadoop. Оба построены для разных вариантов использования.
HBase имеет своего рода архитектуру master-slave с несколькими компонентами, такими как Zookeeper, Namenode, HBase Master (Hmaster), узлы данных и т. Д. Cassandra рассматривает все узлы как master, что означает, что все узлы равны и выполняют все функции.
HBase оптимизирован для чтения, запись происходит только на главный узел и имеет строгую согласованность для чтения после записи. Cassandra имеет отличную производительность чтения одной строки, если выбрана возможная последовательность.
Hbase изначально не поддерживает вторичные индексы, Cassandra поддерживает вторичные индексы для семейств столбцов, для которых известно имя столбца.
Изначально Hbase создавался в Google, и они назвали его BigTable. Даже сейчас API Bigtable и HBase совместимы. Происхождение Cassandra взято из статьи для DynamoDB, которая является базой данных NoSQL от AWS.

Давайте перейдем к следующим вопросам HBase Interview.

3. Каковы основные компоненты Hbase?

Ответ:
HBase a имеет три важных компонента - HMaster, Region Server и ZooKeeper.
i.HBase Master - таблицы HBase разделены на регионы. Во время запуска мастер решает, какую область назначить какому серверу региона (сервер региона будет узлом в кластере). Он также обрабатывает операции с метаданными таблицы, такие как создание или изменение схемы. Этот компонент также играет важную роль в восстановлении после отказа
II. Сервер региона - Как уже упоминалось выше, именно здесь происходит фактическая запись и чтение данных. Это фактические узлы кластера. Это будет иметь области из многих таблиц, что определяется начальным и конечным ключами строки. Типичный региональный сервер может обслуживать до тысячи регионов
iii.ZooKeeper - ZooKeeper является структурой координации кластера, широко используемой в экосистеме Hadoop. Zookeeper отслеживает все серверы (главные и региональные серверы), присутствующие в кластере. Контакты HMaster ZooKeeper и уведомления генерируются в случае ошибок.

4. Что такое HBase Bloom Filter?

Ответ:
Это общие вопросы интервью HBase, задаваемые в интервью. HBase Bloom Filter - это эффективный механизм для проверки того, является ли файл хранилища (когда что-то записывается в HBase, оно сначала записывается в хранилище в памяти, как только это хранилище достигает определенного размера, оно сбрасывается на диск в файл хранилища. ) содержит определенную строку или ячейку строки-столбца. Как правило, единственный способ определить, присутствует ли ключ строки в файле хранилища, - это проверить индекс блока файла, в котором есть ключ строки начала каждого блока в файле хранилища. Фильтры Блума действуют как структура данных в памяти, которая помогает уменьшить чтение с диска только для файлов, которые могут содержать эту строку. Не все файлы хранилища. Таким образом, он действует как индекс в памяти для указания вероятности нахождения строки в определенном файле хранилища.

5. Что такое уплотнение? Объясните разные виды этого.

Ответ:
HBase сохраняет все полученные операции в своей области памяти memstore. Когда буфер памяти заполнен, он сбрасывается на диск. Поскольку это может создавать много маленьких файлов в HDFS, время от времени HBase может выбирать файлы, которые будут сжаты вместе, в один больший. Сжатие называется Minor, когда HBase выбирает только некоторые из HFiles для сжатия, но не все. При сжатии Major все файлы выбираются для уплотнения вместе. Основное уплотнение работает подобно второстепенному, за исключением того, что маркеры удаления можно удалить после того, как они применены ко всем связанным ячейкам, и все дополнительные версии той же ячейки также будут удалены.

Часть 2 - HBase Интервью Вопросы (Advanced)

Давайте теперь посмотрим на расширенные вопросы интервью HBase.

6.Как данные версии HBase?

Ответ:
Когда часть данных вставляется / обновляется / удаляется, HBase создаст новую версию для этого столбца. Фактическое удаление происходит только во время сжатия. Если в определенной ячейке превышено допустимое количество версий, дополнительные версии будут отброшены во время сжатия

7. В чем разница между получением и сканированием?

Ответ:
Get вернет единственную строку из таблицы Hbase на основе заданного ключа строки. Команда сканирования возвращает набор строк в зависимости от заданного условия поиска. Обычно получить быстрее, чем сканирование. Поэтому следует использовать это, если это возможно.

Давайте перейдем к следующим вопросам HBase Interview.

8. Что происходит при удалении строки?

Ответ:
Во время удаления данные команд не удаляются физически из файловой системы, а становятся невидимыми, устанавливая маркер. Физическое удаление происходит во время уплотнения
Маркеры удаления столбца, версии и семейства представляют собой три различных типа маркеров, которые отмечают удаление столбца, версии столбца и семейства столбцов соответственно.

9. Объясните разницу между HBase и Hive.

Ответ:
Это расширенный вопрос интервью HBase, заданный в интервью. HBase и Hive - абсолютно разные технологии обработки данных на основе Hadoop. Hive - это реляционная среда SQL-совместимого распределенного хранилища, а HBase - хранилище ключей-значений NoSQL. Hive действует как слой абстракции поверх Hadoop с поддержкой SQL. Шаблон доступа к данным HBase очень ограничен двумя основными операциями - получением и сканированием. HBase идеально подходит для обработки данных в реальном времени, где Hive - идеальный выбор для пакетной обработки данных.

10. Что такое Hlog и HFile?

Ответ:
HLog - это файл журнала с опережением записи, также известный как WAL, а HFile - это файл реального хранения данных. Данные сначала записываются в файл журнала записи с опережением, а также записываются в MemStore. Когда MemStore заполнен, содержимое MemStore записывается на диск в HFiles.

Рекомендуемая статья

Это было руководство к Списку Вопросов Интервью Hbase и ответам, чтобы кандидат мог легко разобраться в этих Вопросах Интервью Hbase. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Полезные вопросы для группового интервью
  2. Важные основные советы интервью
  3. Основные шаги для подготовки к собеседованию
  4. Интервью Вопросы, чтобы Спросить Финансового Кандидата