Введение в машинное обучение
Артур Самуэль ввел термин «машинное обучение» в 1959 году. Американский пионер в области компьютерных игр и искусственного интеллекта сказал: «Это дает компьютерам возможность учиться без явного программирования. Машинное обучение - это новый девиз, который плавает вокруг. Это заслуживает того, чтобы быть одним из самых интересных подразделов в информатике. Программы искусственного интеллекта, как правило, были явно запланированы для выполнения задач в прошлом. В большинстве случаев «обучение» состояло из настройки нескольких параметров на фиксированную реализацию для добавления фактов в набор других фактов (базы знаний), а затем (эффективно) поиска решения проблемы из одного Известное решение другого. в виде дорожки из нескольких небольших шагов. В этой теме мы собираемся узнать об инструментах машинного обучения.
Что такое инструмент машинного обучения?
Инструменты машинного обучения - это алгоритмические приложения с искусственным интеллектом, которые обеспечивают системы способностью понимать и совершенствовать без значительного участия человека. Это позволяет программному обеспечению без явного программирования прогнозировать результаты более точно. Инструменты машинного обучения с обучающими колесами являются контролируемыми алгоритмами. Они требуют, чтобы человек планировал как вход, так и желаемый результат и обеспечивал обратную связь относительно точности конечных результатов. Неконтролируемые алгоритмы требуют очень небольшого вмешательства человека, используя подход «глубокого обучения», чтобы проверить огромные базы данных и прийти к выводам из предыдущих данных обучения на основе примеров; таким образом, они обычно используются для более сложных задач обработки, таких как распознавание изображений, преобразование речи в текст и создание естественных языков.
Инструменты машинного обучения состоят из
- Подготовка и сбор данных
- Построение моделей
- Развертывание приложений и обучение
Локальные инструменты для телекоммуникаций и дистанционного обучения
Мы можем сравнить инструменты машинного обучения с локальным и удаленным. Вы можете скачать и установить локальный инструмент и использовать его локально, но удаленный инструмент запускается на внешнем сервере.
-
Локальные инструменты
Вы можете скачать, установить и запустить локальный инструмент в вашей локальной среде.
Характеристики локальных инструментов следующие:
- Адаптировано для данных и алгоритмов в памяти.
- Контроль выполнения конфигурации и параметризации.
- Интегрируйте свои системы, чтобы удовлетворить ваши требования.
Примерами локальных инструментов являются Shogun, Golearn for Go и т. Д.
-
Удаленные инструменты
Этот инструмент размещается на сервере и вызывается в вашей локальной среде. Эти инструменты часто называют Машинное обучение как услуга (MLaaS)
- Настроен для больших наборов данных для запуска в масштабе.
- Выполнение нескольких устройств, нескольких ядер и общего хранилища.
- Более простые интерфейсы, которые обеспечивают меньше контроля конфигурации и параметризации алгоритма.
Примерами этих инструментов являются машинное обучение в AWS, прогнозирование в Google, Apache Mahout и т. Д.
Инструменты для машинного обучения:
Ниже представлены различные инструменты машинного обучения, а именно:
TensorFlow
Это библиотека машинного обучения от Google Brain организации искусственного интеллекта Google, выпущенная в 2015 году. Tensor Flow позволяет создавать свои собственные библиотеки. Мы также можем использовать C ++ и язык Python из-за гибкости. Важной характеристикой этой библиотеки является то, что диаграммы потоков данных используются для представления численных расчетов с помощью узлов и ребер. Математические операции представлены узлами, тогда как ребра обозначают многомерные массивы данных, над которыми выполняются операции. TensorFlow используется многими известными компаниями, такими как eBay, Twitter, Dropbox и т. Д. Он также предоставляет отличные инструменты разработки, особенно в Android.
Keras
Keras - это глубоко изученная библиотека Python, которая может работать поверх Theano, TensorFlow. Франсуа Шоле, член команды Google Brain, разработал ее, чтобы дать ученым, работающим с данными, возможность быстро запускать программы машинного обучения. Благодаря использованию высокоуровневого, понятного интерфейса библиотеки и разделения сетей на последовательности отдельных модулей возможно быстрое создание прототипов. Он более популярен из-за пользовательского интерфейса, простоты расширяемости и модульности. Он работает как на CPU, так и на GPU.
Scikit учиться
Scikit-learn, впервые выпущенный в 2007 году, является библиотекой с открытым исходным кодом для машинного обучения. Python является языком сценариев этой платформы и включает в себя несколько моделей машинного обучения, таких как классификация, регрессия, кластеризация и уменьшение размерности. Scikit-learn разработан для трех проектов с открытым исходным кодом - Matplotlib, NumPy и SciPy.
Scikit-learn предоставляет пользователям множество алгоритмов машинного обучения. Библиотека фреймворка фокусируется на моделировании данных, а не на загрузке, суммировании, манипулировании данными.
Caffe2
Caffe2 - это обновленная версия Caffe. Это легкий инструмент машинного обучения с открытым исходным кодом, разработанный Facebook. Он имеет обширную библиотеку машинного обучения для запуска сложных моделей. Кроме того, он поддерживает мобильное развертывание. Эта библиотека имеет C ++ и Python API, что позволяет разработчикам сначала создавать прототипы, а оптимизацию можно выполнить позже.
Apache Spark MLlib
Apache Spark MLlib - это распределенная среда для машинного обучения. Ядро Spark разработано наверху. Apache запускает MLlib в девять раз быстрее, чем дисковая реализация. Он широко используется в качестве проекта с открытым исходным кодом, который делает упор на машинное обучение, чтобы упростить его.
Apache Spark MLlib имеет библиотеку для масштабируемого профессионального обучения. MLlib включает в себя алгоритмы регрессии, коллаборативные фильтры, кластеризацию, деревья решений, конвейерные API более высоких уровней.
OpenNN
OpenNN разработан компанией Artelnics по искусственному интеллекту. OpenNN - это библиотека встроенных программ для аналитики, написанная на C ++. Наиболее успешным методом машинного обучения является внедрение нейронных сетей. Это высоко в производительности. Скорость выполнения и выделения памяти этой библиотеки выделяются.
Amazon SageMaker
Amazon SageMaker - это полностью управляемый сервис, который позволяет исследователям и разработчикам данных быстро и легко создавать, обучать и внедрять модели машинного обучения в любом масштабе. Amazon SageMaker поддерживает ноутбуки Jupyter с открытым исходным кодом для веб-приложений, которые помогают разработчикам обмениваться живым кодом. Эти ноутбуки включают драйверы, пакеты и библиотеки для распространенных платформ глубокого обучения и сред для пользователей SageMaker. Amazon SageMaker дополнительно шифрует модели как во время, так и во время транзита через сервис управления ключами AWS, а запросы API выполняются через безопасное соединение с уровнем сокетов. SageMaker также хранит код в томах, которые защищены и зашифрованы группами безопасности.
Вывод
Перед разработкой приложений машинного обучения очень важно выбрать инструмент машинного обучения, который имеет обширные библиотеки, отличный пользовательский интерфейс и поддержку распространенных языков программирования. Так что это было руководство по инструментам машинного обучения, которые помогут в выборе необходимой технологии.
Рекомендуемые статьи
Это было руководство по инструментам машинного обучения. Здесь мы обсудили Инструменты для машинного обучения и локальные инструменты для телекоммуникаций и дистанционного обучения. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше-
- Что такое машинное обучение?
- Методы машинного обучения
- Карьера в машинном обучении
- Машинное обучение против статистики
- Matplotlib In Python