Содержание
Алгоритмы обучения
Алгоритмы обучения с учителем
Использует помеченные обучающие данные для изучения функции отображения, которая превращает входные переменные (X) в выходные переменные (Y).
Виды алгоритмов обучения с учителем (Supervised Learning Algorithms):
Регрессия используется для прогнозирования результата данной выборки, когда выходная переменная имеет форму реальных значений. Например, регрессионная модель может обрабатывать входные данные для прогнозирования количества осадков, роста человека и т. д. Примерами алгоритмов регрессии являются: линейная регрессия, K-ближайших соседей (KNN).
Классификация используется для прогнозирования результата данной выборки, когда выходная переменная представлена в виде категорий. Модель классификации может рассматривать входные данные и пытаться предсказать такие ярлыки, как «больной» или «здоровый». Примером алгоритма классификации служит алгоритм Дерева решений (Decision Tree Classifier).
Ансамблирование — это еще один тип контролируемого обучения. Это означает объединение прогнозов нескольких моделей машинного обучения, которые по отдельности слабы, для получения более точного прогноза на новой выборке. Примерами данных алгоритмов становятся алгоритм бэггинга со случайными лесами, алгоритм адаптивного бустинга.
Алгоритмы обучения без учителя
Используют немаркированные обучающие данные для моделирования базовой структуры данных.
Виды алгоритмов обучения без учителя (Unsupervised Learning Algorithms):
Ассоциация используется для определения вероятности совпадения элементов в коллекции. Данный алгоритм широко используется в анализе потребительской корзины. Примером алгоритма ассоциации служит алгоритм Априори.
Кластеризация используется для группировки образцов таким образом, чтобы объекты в одном кластере были более похожи друг на друга, чем на объекты из другого кластера. Примером алгоритма кластеризации данных служит алгоритм K-средних.
Уменьшение размерности используется для уменьшения количества переменных в наборе данных, обеспечивая при этом передачу важной информации. Уменьшение размерности может быть выполнено с использованием методов извлечения признаков и методов выбора признаков. Извлечение признаков выполняет преобразование данных из пространства высокой размерности в пространство низкой размерности. Пример: Алгоритм PCA представляет собой подход к извлечению признаков.
Алгоритмы обучения с подкреплением
en: Reinforcement learning.
Обучение с подкреплением — это тип алгоритма машинного обучения, который позволяет агенту выбирать наилучшее следующее действие на основе его текущего состояния, изучая поведение, которое максимизирует вознаграждение.
Алгоритмы подкрепления обычно изучают оптимальные действия методом проб и ошибок. Представьте, например, видеоигру, в которой игроку нужно перемещаться в определенные места в определенное время, чтобы заработать очки. Алгоритм подкрепления, играющий в эту игру, начинал бы со случайных перемещений, но со временем путем проб и ошибок он узнавал бы, куда и когда ему нужно переместить внутриигрового персонажа, чтобы максимизировать его общее количество очков.
Примером алгоритмов с подкреплением служат «Генетические алгоритмы», «Альфа- система подкрепления», «Гамма-система подкрепления».