Контролируемое обучение

В машину подается известный набор данных, который включает в себя желаемые входные данные и выходы, и расчет должен определить стратегию, чтобы решить, как достичь этих ориентиров. Алгоритм различает закономерности в информации, учится на наблюдениях и формирует результаты.

  • Классификация. При классификации программа машинного обучения должна сделать вывод на основе известных значений и решить, к какой категории следует отнести новый объект. Например, при определении того, является ли письмо спамом, программа должна видеть существующую информацию наблюдений и соответствующим образом направлять электронные письма в правильный заполнитель.
  • Регрессия. Программа машинного обучения должна оценивать и понимать связь между одной зависимой переменной и другими независимыми переменными.

Обучение под наблюдением

Полууправляемое обучение включает в себя комбинацию как именованной, так и немаркированной информации во время обучения. Именованная информация — это в основном данные, которые были идентифицированы и связаны с категорией и имеют значимый контекст, в то время как немаркированная информация не имеет каких-либо идентифицированных характеристик. Используя эту комбинацию, вычисления машинного обучения могут научиться называть немаркированные данные.

Обучение без учителя

Здесь алгоритм машинного обучения формулирует информацию из данных для распознавания закономерностей. Алгоритм определяет взаимосвязь и связь, анализируя доступную информацию. Алгоритм развертывается для расшифровки информации из наборов и соответствующей адресации этой информации. Затем вычисление пытается составить эту информацию в структуре. Это помогает собирать информацию в кластеры, что делает ее более организованной.

  • Кластеризация. Этот метод включает сбор наборов сопоставимой информации (на основе определенных критериев). Он разбивает информацию на несколько групп и выполняет проверку каждого набора информации для выявления закономерностей.
  • Правила ассоциации. Этот метод связывает один элемент данных с другим для проверки надежности, чтобы связь между переменными в наборе данных могла помочь сформировать осмысленный вывод.

Обучение с подкреплением

В этом типе алгоритму машинного обучения задается набор параметров и значений. Описывая правила, алгоритм машинного обучения затем пытается исследовать отличительные альтернативы и возможные результаты, наблюдая и оценивая каждый результат, чтобы решить, какой из них является идеальным. Этот метод основан на методе проб и ошибок. Он учится на прошлых встречах и начинает корректировать свой подход в зависимости от обстоятельств, чтобы определить точный результат.

Популярные алгоритмы машинного обучения

  1. Машина опорных векторов. Машина опорных векторов исследует информацию, используемую для классификации. Информация сгруппирована по категориям, что достигается путем предоставления набора иллюстраций, каждый из которых принадлежит к одной или другой из двух категорий. Расчет в этой точке работает, чтобы распределить неиспользованные значения по той или иной категории.
  2. Кластеризация K-средних.Кластеризация K-средних работает путем разделения n наблюдений на k кластеров. Он работает итеративно, чтобы относить каждую информационную точку к одному из K кластеров на основе ближайшего среднего значения.
  3. Наивный байесовский классификатор. Наивный байесовский классификатор основан на гипотезе Байеса. Это позволяет аналитику предвидеть класс/категорию на основе заданного набора основных моментов, используя вероятность.
  4. К-ближайший сосед.Расчет К-ближайшего соседа измеряет вероятность того, что информационная точка является частью той или иной группы. В основном он просматривает информацию вокруг одной точки, чтобы решить, к какой группе она действительно относится.
  5. Дерево решений.Дерево решений – это древовидная структура, похожая на блок-схему, в которой используется стратегия ветвления для демонстрации результата выбора. Каждый узел внутри дерева относится к метке класса, и каждая ветвь формируется на основе результата этого теста.
  6. Линейная регрессия. Линейная регрессия позволяет аналитикам понять значение одного элемента на основе значения другого.
  7. Искусственные нейронные сети. ИНС состоит из «модулей», организованных в виде слоев, каждый из которых взаимодействует со слоями с обеих сторон. ИНС мотивированы естественными структурами, такими как мозг, и тем, как они обрабатывают данные. ANN в основном представляют собой обширные, взаимосвязанные компоненты обработки, работающие в гармонии для решения конкретных проблем.
  8. Логистическая регрессия. В этом типе оценивается вероятность события, происходящего на основе заданного набора данных.
  9. Случайные леса.Случайные леса объединяют различные вычисления для получения превосходных результатов. Каждый расчет начинается с дерева решений. Урожайность нескольких деревьев объединяется, чтобы прийти к общему выводу.