10 вопросов для интервью с основными аналитиками данных (Обновлено на 2019 г.)

Содержание:

Anonim

Введение в Data Analytics Интервью Вопросы и ответы

Итак, вы, наконец, нашли работу своей мечты в Data Analytics, но вам интересно, как взломать интервью Data Analytics 2019 года и какие могут быть вероятные вопросы для интервью с Data Analytics. Каждое собеседование по анализу данных отличается, и объем работы также отличается. Помня об этом, мы разработали самые распространенные вопросы и ответы на вопросы об аналитике данных, чтобы помочь вам успешно пройти собеседование с аналитикой данных.

Ниже приведены лучшие вопросы интервью с аналитиками данных 2019 года, которые чаще всего задаются в ходе интервью.

1. В чем разница между интеллектуальным анализом данных и анализом данных?

Ответ:

Сбор данныхАнализ данных
Гипотеза не требуется для интеллектуального анализа данныхАнализ данных начинается с гипотезы.
Data Mining требует чистых и хорошо документированных данных.Анализ данных включает в себя очистку данных.
Результаты интеллектуального анализа данных не всегда легко интерпретировать.Аналитики данных интерпретируют результаты и представляют их заинтересованным сторонам.
Алгоритмы интеллектуального анализа данных автоматически разрабатывают уравнения.Аналитики данных должны разработать свои собственные уравнения.

2. Укажите, какие существуют шаги в аналитическом проекте?

Ответ:
Аналитика данных имеет дело со сбором, очисткой, преобразованием и моделированием данных, чтобы получить ценную информацию и поддержать лучшее принятие решений в организации. Шаги, вовлеченные в процесс анализа данных, следующие:

Изучение данных. Исследовав проблему бизнеса, аналитик данных должен проанализировать ее причину.
Подготовка данных - на этом этапе процесса анализа данных мы обнаруживаем аномалии данных, такие как пропущенные значения в данных.
Моделирование данных - этап моделирования начинается после подготовки данных. Моделирование - это итеративный процесс, в котором модель запускается многократно для улучшения. Моделирование данных обеспечивает наилучший результат для бизнес-задачи.
Проверка. На этом этапе модель, предоставленная клиентом, и модель, разработанная аналитиком данных, проверяются друг на друга, чтобы выяснить, будет ли разработанная модель соответствовать требованиям бизнеса.
Внедрение модели и отслеживание. На этом последнем этапе реализации модели анализа данных выполняется и после того, как выполняется отслеживание, чтобы убедиться, что модель реализована правильно или нет?

3. Какова ответственность аналитика данных?

Ответ:
• Решать связанные с бизнесом проблемы для клиентов и выполнять операции аудита данных.
• интерпретировать данные с использованием статистических методов.
• Определить области для улучшения возможностей.
• Анализировать, идентифицировать и интерпретировать тенденции или закономерности в сложных наборах данных.
• Получать данные из первичных или вторичных источников данных.
• Поддерживать базы данных / системы данных.
• Найдите и исправьте проблемы с кодом, используя показатели производительности.
• Защита базы данных путем разработки системы доступа.

4. Что такое коллизии хеш-таблиц? Как это избежать?

Ответ:
Столкновение хеш-таблицы происходит, когда два разных ключа хешируют одно и то же значение. Есть много способов избежать коллизий хеш-таблиц, здесь мы перечислим два:
Раздельное связывание: используется структура данных, которая хэшируется в одном и том же слоте для хранения нескольких элементов.
Открытая адресация: он ищет другие слоты, используя вторую функцию, и сохраняет элемент в первом пустом слоте.

5. Список лучших инструментов, которые могут быть полезны для анализа данных?

Ответ:
• Tableau
• RapidMiner
• OpenRefine
• KNIME
• Операторы поиска Google
• Solver
• NodeXL
• И.О.
• Вольфрам Альфа
• Google Fusion Tables

6.В чем разница между интеллектуальным анализом данных и профилированием данных?

Ответ:
Разница между интеллектуальным анализом данных и профилированием данных заключается в следующем:
• Профилирование данных: оно предназначено для мгновенного анализа отдельных атрибутов, таких как изменение цены, различная цена и их частота, частота появления нулевых значений, тип данных, длина и т. Д.
• Интеллектуальный анализ данных: он фокусируется на зависимостях, обнаружении последовательностей, хранении отношений между несколькими атрибутами, кластерном анализе, обнаружении необычных записей и т. Д.

7. Объясните Алгоритм среднего значения и Алгоритм иерархической кластеризации?

Ответ:
Алгоритм K-Mean - K mean - известный метод разделения. В алгоритме K-средних кластеры являются сферическими, то есть точки данных в кластере центрированы на этом кластере. Кроме того, дисперсия кластеров аналогична, т.е. каждая точка данных принадлежит ближайшему кластеру
Алгоритм иерархической кластеризации - Алгоритм иерархической кластеризации объединяет и разделяет существующие группы и создает для них иерархическую структуру, чтобы показать порядок, в котором группы делятся.

8. Что такое очистка данных? Назовите несколько рекомендаций, которым вы должны следовать при очистке данных?

Ответ:
Из данного набора данных крайне важно отсортировать информацию, необходимую для анализа данных. Очистка данных - это важный шаг, при котором данные проверяются на наличие любых аномалий, удаление повторяющейся и неверной информации и т. Д. Очистка данных не включает удаление какой-либо существующей информации из базы данных, она просто повышает качество данных, чтобы их можно было использовать для анализа.,
Некоторые из лучших практик для очистки данных включают в себя -
• Разработка плана качества данных, чтобы определить, где возникают максимальные ошибки качества данных, чтобы вы могли оценить основную причину и составить план в соответствии с этим.
• Следуйте общепринятому методу обоснования необходимой информации до ее ввода в информацию.
• Определите любые дубликаты данных и подтвердите точность данных, поскольку это сэкономит много времени во время анализа.
• Отслеживание всех операций по улучшению, выполненных на информации, невероятно необходимо для того, чтобы вы повторяли или убирали любые операции по мере необходимости.

9. Какие статистические методы полезны для аналитика данных?

Ответ:
Статистические методы, которые полезны для исследователя данных,
• Байесовский метод
• марковский процесс
• Пространственные и кластерные процессы
• Ранговая статистика, процентиль, обнаружение выброса
• методы вменения и т. Д.
• Симплексный алгоритм
• математическая оптимизация

10. Объясните, что такое вменение? Перечислите различные типы методов вменения? Какой метод вменения является более выгодным?

Ответ:
Во время вменения мы имеем тенденцию заменять недостающую информацию замещаемыми значениями. Методы вменения включают в себя:
• Одиночное вменение: Одиночное вменение означает, что пропущенное значение заменяется значением. В этом методе размер выборки извлекается.
• Импутация горячей колоды: пропущенное значение вменяется из случайно выбранной аналогичной записи с использованием перфокарты
• Импутация холодной колоды: она работает так же, как вменение горячей колоды, но немного более продвинутая и выбирает доноров из других наборов данных.
• Среднее вменение: включает в себя замену отсутствующего значения на предсказанные значения других переменных.
• Вменение регрессии: включает в себя замену отсутствующего значения прогнозируемыми значениями определенного значения в зависимости от других переменных.
• Стохастическая регрессия: она аналогична вменению регрессии, однако она добавляет общую регрессионную дисперсию к вменению регрессии
• Множественное вменение: в отличие от одного вменения, множественное вменение оценивает значения несколько раз

Хотя одноименное вложение широко используется, оно не отражает неопределенность, создаваемую случайными пропущенными данными. Таким образом, множественные вменения более выгодны, чем единичные вменения в случае случайного отсутствия данных.

Рекомендуемые статьи

Это было исчерпывающее руководство по вопросам интервью с аналитиками данных и ответы, так что кандидат может легко разобрать эти вопросы интервью с аналитиками данных. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. 10 полезных гибких вопросов и ответов на интервью
  2. 8 Потрясающих Алгоритм Интервью Вопросы
  3. 25 самых важных вопросов по информатике
  4. 10 удивительных интервью с Data Engineer: вопросы и ответы