Введение в машинное обучение

Машинное обучение (ML) - это искусство разработки алгоритмов без явного программирования. За последние два десятилетия были получены эксабайты данных, и большинство отраслей были полностью оцифрованы. Эти существующие данные используются алгоритмами машинного обучения (ML) для разработки прогностических моделей и автоматизации нескольких трудоемких задач.

Давайте посмотрим, чем алгоритмы ML отличаются от запрограммированных алгоритмов на основе логики:

Для алгоритма, основанного на логике, последовательность действий хорошо определена и известна заранее, однако существует несколько реальных сценариев (таких как классификация изображений), где логика не может быть определена. В таких случаях машинное обучение оказалось чрезвычайно полезным. Методы машинного обучения принимают входные параметры и ожидаемые эталонные выходные данные и генерируют логику, которая затем развертывается в производстве.

Основные компоненты введения в машинное обучение:

Машинное обучение подразделяется на следующие категории:

1. Контролируемое машинное обучение

Алгоритм контролируемого ML принимает входные данные (функции) вместе с выходными данными, помеченными на входе. В основном они используются для задач классификации и регрессии.

Классификация:

Решение о приемлемости ссуды: автоматизируйте процесс утверждения ссуды, используя прошлые данные с такими параметрами, как возраст, доход, образование, город и т. Д., Чтобы решить, может ли ссуда заявителя быть утверждена.

Регресс:

Прогнозирование цены дома: прогнозирование цены дома с использованием таких характеристик, как размер дома, возраст дома, количество комнат, местность и т. Д.

2. Неуправляемое машинное обучение

Необслуживаемые методы ML не требуют помеченных данных и используются для кластеризации данных в разные сегменты на основе входных функций.

Пример. Чтобы разделить группу из 100 человек на 5 кластеров, входные функции могут включать интересы, хобби, социальные связи и т. Д.

Применение машинного обучения

За последнее десятилетие введение в машинное обучение изменило несколько отраслей, включая здравоохранение, социальные сети, цифровой маркетинг, недвижимость, логистику, цепочку поставок и производство. Первопроходцы в этих отраслях уже получили значительную прибыль. Существует растущий спрос на квалифицированную рабочую силу с машинным обучением наряду со знанием предметной области.

Ниже приведены несколько приложений, где методы ML сыграли значительную роль:

Классификация спама:

Чтобы классифицировать почту как спам / не спам, используя помеченные ответы с использованием таких данных, как содержимое сообщения, использование словарного запаса в рекламных письмах, адрес электронной почты отправителя, IP-адрес отправителя, использование гиперссылок, пунктуация и т. Д.

Обнаружение рака:

ML все чаще используется в здравоохранении для диагностики и даже для выявления рака с использованием медицинских данных о предыдущих пациентах. Для выявления рака молочной железы в качестве входных данных алгоритм обучения принимает такие данные, как размер опухоли, радиус, кривизна и периметр. На выходе мы получаем вероятность, если опухоль злокачественная или нет.

Прогноз продаж :

Все больше поставщиков оцифровывают свои записи, многие из них начали использовать инструменты машинного обучения для прогнозирования продаж конкретного товара в течение данной недели, чтобы они могли запасать достаточный объем запасов. Введение В методы машинного обучения будут взяты данные о продажах за предыдущий год по различным предметам, найдены модели сезонных колебаний и даны конкретные прогнозы по продаже определенных предметов. Мы также можем определить низкоэффективные товары с точки зрения продаж.

Распознавание лица:

Вы, вероятно, заметили, загружая фотографии в Facebook, что он помечает лица ваших друзей на их имена. В бэкэнде машина / алгоритмы глубокого обучения делают эту работу. То же фундаментальное введение в принципы машинного обучения также используется для распознавания лиц, где вводятся входные изображения лиц, а нейронные сети обучаются для классификации этих изображений.

Классификация текста:

По мере того, как все больше и больше людей подключается к сети, для компаний, занимающихся веб-сайтами и социальными сетями, такими как Twitter, Facebook и Quora, стало обязательным использование систем классификации на основе текста. Twitter / Quora использует это для выявления комментариев / постов ненависти. Некоторые новостные компании также используют алгоритмы классификации текста для группировки похожих статей.

Аудио / Голосовой перевод:

Вы никогда не задумывались над тем, как такие устройства, как Alexa, Siri, Google, становятся интеллектуальными изо дня в день в понимании аудиоданных на разных языках с разными акцентами. Огромный объем данных обучается на этих устройствах для ознакомления с методами машинного обучения, что делает это возможным.

Системы обнаружения мошенничества:

Системы обнаружения мошенничества на основе ML используются несколькими компаниями электронной коммерции для выявления клиентов, создающих поддельные заказы, а также для устранения поставщиков, продающих контрафактные продукты на платформе. Банковские отрасли и другие финансовые стартапы в значительной степени полагаются на методы ML для выявления мошеннических операций

Рекомендации Двигатели

Netflix использует ML без присмотра, чтобы рекомендовать фильмы, в то время как Amazon использует его, чтобы рекомендовать продукты для покупки.

преимущества

Автоматизировать трудоемкие задачи:

Приложения на основе ML автоматизировали несколько задач, таких как принятие решений на низком уровне, ввод данных, телеграммы, процессы утверждения кредитов.

Экономия затрат:

После того, как алгоритм разработан и запущен в производство, он может привести к значительной экономии средств, поскольку человеческий труд и принятие решений минимальны.

Время оборота:

Для многих приложений общее время имеет первостепенное значение. ML смогла сократить время в таких областях, как страховые выплаты, когда пользователь загружает фотографии и рассчитывается страховая сумма. Это также помогло компаниям электронной коммерции справиться с возвратом проданных запасов.

Принятие решений на основе данных:

Не только корпорации, но и многие правительства полагаются на ОД в принятии решений при принятии решений о том, в какие проекты инвестировать средства и как оптимально использовать существующие ресурсы.

Недостатки

Алгоритмы ML могут быть предвзятыми:

Много раз входные данные для алгоритма ML смещаются к определенному полу, расе, стране, касте и т. Д. Это приводит к тому, что алгоритмы ML распространяют нежелательное смещение в процессе принятия решений. Это наблюдалось в некоторых приложениях, в которых использовался ML-подобный процесс приема в школу / колледж и рекомендации в социальных сетях.

Требовать больших данных для достижения приемлемой точности:

В то время как люди могут легко учиться для небольших наборов данных, для некоторых приложений введение в машинное обучение требует огромных объемов данных для достижения достаточной точности.

Управлять решением пользователя:

Недавно аналитическая фирма Cambridge Analytica использовала алгоритмы ML в социальных сетях для нацеливания и влияния на решения избирателей.

В настоящее время введение в алгоритм машинного обучения может хорошо подойти для будущего:

Техника ML, обученная на текущем наборе данных, может не подходить для будущего, поскольку распределение входных данных может значительно измениться со временем. Одной из мер противодействия этому является периодическое переобучение модели.

Введение в машинное обучение - Применение машинного обучения

Содержание: