Введение в методы ядра

Ядра или методы ядра (также называемые функциями ядра) - это наборы различных типов алгоритмов, которые используются для анализа паттернов. Они используются для решения нелинейной задачи с использованием линейного классификатора. Методы ядра используются в SVM (Машины опорных векторов), которые используются в задачах классификации и регрессии. SVM использует так называемый «трюк с ядром», в котором данные преобразуются и определяется оптимальная граница для возможных выходных данных.

Необходимость в методе ядра и его работе

Прежде чем мы начнем работать с методами ядра, более важно понять машины опорных векторов или SVM, потому что ядра реализованы в моделях SVM. Итак, Машины опорных векторов - это контролируемые алгоритмы машинного обучения, которые используются в задачах классификации и регрессии, таких как классификация яблок по классу фруктов при классификации Льва по классу животных.

Чтобы продемонстрировать, вот как выглядят машины опорных векторов:

Здесь мы видим гиперплоскость, которая отделяет зеленые точки от синих. Гиперплоскость на одно измерение меньше, чем окружающая плоскость. Например, на рисунке выше, у нас есть 2 измерения, которые представляют окружающее пространство, но одиночка, которая делит или классифицирует пространство, на одно измерение меньше, чем окружающее пространство, и называется гиперплоскостью.

Но что, если у нас есть такой вклад:

Очень трудно решить эту классификацию с использованием линейного классификатора, поскольку нет хорошей линейной линии, которая могла бы классифицировать красные и зеленые точки, поскольку точки распределены случайным образом. Здесь используется функция ядра, которая переносит точки в более высокие измерения, решает проблему и возвращает результат. Подумайте об этом таким образом, мы можем видеть, что зеленые точки заключены в некоторой области периметра, в то время как красные лежат за ее пределами, также могут быть другие сценарии, где зеленые точки могут быть распределены в области трапециевидной формы.

Так что мы делаем, чтобы преобразовать двумерную плоскость, которая была сначала классифицирована по одномерной гиперплоскости («или прямая линия»), в трехмерную область, и здесь наш классификатор, т.е. гиперплоскость, не будет прямой линией, а плоскость, которая будет вырезать площадь.

Чтобы получить математическое понимание ядра, давайте разберемся с уравнением ядра Лили Цзяна:

К (х, у) = где,
K - функция ядра,
X и Y - размерные входы,
f - карта из n-мерного в m-мерное пространство и,
это скалярное произведение.

Иллюстрация с помощью примера.

Допустим, у нас есть две точки: x = (2, 3, 4) и y = (3, 4, 5)

Как мы уже видели, K (x, y) =.

Давайте сначала посчитаем

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
так,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) и
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
Итак, скалярное произведение,
f (x). f (y) = f (2, 3, 4). F (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444
И,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Это, как мы выяснили, f (x) .f (y) и K (x, y) дают нам один и тот же результат, но первый метод потребовал много вычислений (из-за проецирования 3 измерений в 9 измерений) при использовании ядро было намного проще.

Типы ядра и методы в SVM

Давайте посмотрим на некоторые функции ядра или типы, которые используются в SVM:

1. Ядро лайнера. Допустим, у нас есть два вектора с именами x1 и Y1, тогда линейное ядро ​​определяется как произведение точек этих двух векторов:

К (х1, х2) = х1. x2

2. Ядро полинома. Ядро полинома определяется следующим уравнением:

K (x1, x2) = (x1. X2 + 1) d,

Где,

d - степень многочлена, а x1 и x2 - векторы

3. Ядро Гаусса - это ядро ​​является примером ядра радиальной базисной функции. Ниже приведено уравнение для этого:

Данная сигма играет очень важную роль в производительности ядра Гаусса и не должна быть ни завышена, ни недооценена, она должна быть тщательно настроена в соответствии с проблемой.

4. Экспоненциальное ядро - это в тесной связи с предыдущим ядром, то есть ядро ​​Гаусса с той лишь разницей, что квадрат нормы удаляется.

Функция экспоненциальной функции:


Это также радиальная базовая функция ядра.

5. Ядро Лапласа - этот тип ядра менее подвержен изменениям и полностью равен ранее обсужденному ядру экспоненциальной функции, уравнение ядра Лапласа имеет вид:

6. Гиперболическое или сигмовидное ядро - это ядро ​​используется в областях нейронной сети машинного обучения. Функция активации для сигмовидного ядра - это биполярная сигмовидная функция. Уравнение для гиперболической функции ядра имеет вид:

Это ядро ​​очень широко используется и популярно среди машин опорных векторов.

7. Ядро радиального базиса Anova. Известно, что это ядро ​​очень хорошо работает в многомерных задачах регрессии, подобно ядрам Гаусса и Лапласа. Это также входит в категорию ядра с радиальным основанием.

Уравнение для ядра Anova:

Существует гораздо больше типов метода ядра, и мы обсудили наиболее используемые ядра. Это зависит исключительно от типа проблемы, которая решит функцию ядра, которая будет использоваться.

Вывод

В этом разделе мы увидели определение ядра и его работу. Мы попытались объяснить с помощью диаграмм работу ядер. Затем мы попытались дать простую иллюстрацию с использованием математики о функции ядра. В заключительной части мы увидели различные типы функций ядра, которые широко используются сегодня.

Рекомендуемые статьи

Это руководство по методам ядра. Здесь мы обсуждаем введение, необходимость, это работает и типы методов ядра с соответствующим уравнением. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Алгоритмы интеллектуального анализа данных
  2. Алгоритм кластеризации K-средних
  3. Алгоритм грубой силы
  4. Алгоритм дерева решений
  5. Ядерные методы в машинном обучении
  6. Дерево решений в машинном обучении