Введение в линейную алгебру в машинном обучении

Линейная алгебра является частью математики, которая включает в себя линейные уравнения и их представления через матрицы и векторные пространства. Помогает в описании функций алгоритмов и их реализации. Он используется с табличными данными или изображениями, чтобы лучше настроить алгоритмы для получения наилучшего результата. В этой теме мы собираемся узнать о линейной алгебре в машинном обучении.

Матрица: это массив чисел в прямоугольной форме, представленный строками и столбцами.

Пример:

Вектор: вектор - это строка или столбец матрицы.

Пример:

Тензор: Тензор - это массив чисел или функций, которые трансмутируют с определенными правилами при изменении координат.

Как работает линейная алгебра в машинном обучении?

Поскольку машинное обучение является точкой соприкосновения для информатики и статистики, линейная алгебра помогает объединить науку, технологии, финансы и счета, а также коммерцию. Numpy - это библиотека на Python, которая работает над многомерными массивами для научных вычислений в Data Science и ML.

Линейная алгебра функционирует различными способами, что отражено в некоторых примерах, перечисленных ниже:

1. Набор данных и файлы данных

Данные - это матрица или структура данных в линейной алгебре. Набор данных содержит набор чисел или данных в табличной форме. Строки представляют наблюдения, тогда как столбцы представляют его особенности. Каждый ряд имеет одинаковую длину. Итак, данные векторизованы. Строки предварительно сконфигурированы и вставляются в модель по одному для более простых и достоверных вычислений.

2. Изображения и фотографии

Все изображения имеют табличную структуру. Каждая ячейка в черно-белых изображениях содержит высоту, ширину и значение в один пиксель. Точно так же цветные изображения имеют 3-пиксельные значения, кроме высоты и ширины. Он формирует матрицу в линейной алгебре. Все виды редактирования, такие как обрезка, масштабирование и т. Д., А также методы манипуляции выполняются с использованием алгебраических операций.

3. Регуляризация

Регуляризация - это метод, который минимизирует размер коэффициентов при вставке их в данные. L1 и L2 представляют собой некоторые распространенные методы реализации в регуляризации, которые являются мерами величины коэффициентов в векторе.

4. Глубокое обучение

Этот метод в основном используется в нейронных сетях с различными реальными решениями, такими как машинный перевод, субтитры, распознавание речи и многие другие области. Он работает с векторами, матрицами и даже тензорами, поскольку требует добавления и умножения линейных структур данных.

5. Одна горячая кодировка

Это популярная кодировка для категориальных переменных для облегчения операций в алгебре. Таблица состоит из одного столбца для каждой категории и строки для каждого примера. Цифра 1 добавляется для категориального значения, за которым следуют 0 в остальных и т. Д., Как указано ниже:

6. Линейная регрессия

Линейная регрессия, один из статистических методов, используется для прогнозирования числовых значений для задач регрессии, а также для описания взаимосвязи между переменными.

Пример: y = A. b, где A - набор данных или матрица, b - коэффициент, а y - выход.

7. Анализ основных компонентов или PCA

Анализ основных компонентов применим при работе с многомерными данными для визуализации и операций с моделями. Когда мы находим нерелевантные данные, мы склонны удалять лишние столбцы. Таким образом, PCA действует как решение. Матричная факторизация является основной целью PCA.

8. Разложение на одно значение или СВД

Это также метод матричной факторизации, используемый в основном для визуализации, уменьшения шума и т. Д.

9. Скрытый семантический анализ

В этом процессе документы представлены в виде больших матриц. Документ, обработанный в этих матрицах, легко сравнивать, запрашивать и использовать. Создается матрица, в которой строки представляют слова, а столбцы - документы. SVD используется для уменьшения количества столбцов при сохранении сходства.

10. Рекомендательные системы

Прогнозные модели опираются на рекомендации продуктов. С помощью линейной алгебры SVD функционирует для очистки данных, используя евклидово расстояние или точечные произведения. Например, когда мы покупаем книгу на Amazon, появляются рекомендации, основанные на нашей истории покупок, оставляя в стороне другие не относящиеся к делу предметы.

Преимущества линейной алгебры в машинном обучении

  • Действует как прочная основа для машинного обучения с включением математики и статистики.
    Табличные и изображения могут использоваться в линейных структурах данных.
  • Это также дистрибутив, ассоциативность и коммуникативность.
  • Это простой, конструктивный и универсальный подход в ОД.
  • Линейная алгебра применима во многих областях, таких как предсказания, анализ сигналов, распознавание лиц и т. Д.

Функции линейной алгебры в машинном обучении

Есть некоторые функции линейной алгебры, которые жизненно важны для операций ML и Data Science, как описано ниже:

1. Линейная функция

Алгоритм линейной регрессии использует линейную функцию, где выходные данные являются непрерывными и имеют постоянный наклон. Линейные функции имеют прямую линию на графике.

Р (х) = х + Ь

Где F (x) - значение функции,

m - наклон линии,

b - значение функции, когда x = 0,

х значение х-координаты.

Пример: у = 5х + 25

Пусть x = 0, тогда y = 5 * 1 + 25 = 25

Пусть x = 2, тогда y = 5 * 2 + 25 = 40

2. Идентичность Функция

Функция идентичности работает по неконтролируемому алгоритму и в основном используется в нейронных сетях в ML, где выход многослойной нейронной сети равен ее входу, как указано ниже:

Для каждого x f (x) отображается в x, то есть x отображается в себя.

Пример: х + 0 = х

х / 1 = х

1 ---> 1

2 ---> 2

3 ---> 3

3. Композиция

ML использует в своих алгоритмах функции компоновки и конвейеризации высшего порядка для математических вычислений и визуализаций. Композиционная функция описана ниже:

(GOF) (х) = G (F (х))

Пример: let g (y) = y

F (X) = х + 1

GOF (х + 1) = х + 1

4. Обратная функция

Инверсия - это функция, которая переворачивает себя. Функции f и g обратны, если туман и gof определены и являются тождественными функциями

Пример:

5. Обратимая функция

Функция с инверсией является обратимой.

один к одному

на

Вывод

Линейная алгебра является подполем математики. Однако в машинном обучении он имеет более широкое применение - от записи до реализации алгоритмов в наборах данных и изображениях. С помощью ML алгебра получила большее влияние в реальных приложениях, таких как анализ поисковых систем, распознавание лиц, предсказания, компьютерная графика и т. Д.

Рекомендуемые статьи

Это руководство по линейной алгебре в машинном обучении. Здесь мы обсуждаем, как линейная алгебра работала в машинном обучении с преимуществами и некоторые примеры. Вы также можете посмотреть на следующую статью.

  1. Гиперпараметр машинного обучения
  2. Кластеризация в машинном обучении
  3. Машинное обучение данным науки
  4. Неуправляемое машинное обучение
  5. Разница между линейной регрессией и логистической регрессией