Линейные модели. Градиентный алгоритм
Что такое машинное обучение? Обучающая выборка и признаковое пространство
Постановка задачи машинного обучения
Линейная модель. Понятие переобучения
Способы оценивания степени переобучения моделей
Уравнение гиперплоскости в задачах бинарной классификации
Решение простой задачи бинарной классификации
Функции потерь в задачах линейной бинарной классификации
Стохастический градиентный спуск SGD и алгоритм SAG
Пример использования SGD при бинарной классификации образов
Оптимизаторы градиентных алгоритмов: RMSProp, AdaDelta, Adam, Nadam
L2-регуляризатор. Математическое обоснование и пример работы
L1-регуляризатор. Отличия между L1- и L2-регуляризаторами
Обучающие курсы
Python Python ООП Django C/C++ ООП C++ Машинное обучение Нейронные сети Структуры данных
Телеграм-каналы
Канал selfedu_rus Python Django Машинное обучение Java и С++
Наши каналы

Главная
ML
Линейные модели. Градиентный алгоритм

Решение простой задачи бинарной классификации

Практический курс по ML: https://stepik.org/course/209247/

Смотреть материал на YouTube | RuTube

На этом занятии я хочу привести простой пример решения задачи бинарной классификации линейно разделимых образов. Это позволит вам лучше понять специфику решения подобных задач.

Напомню, что на предыдущем занятии мы с вами определили, следующий алгоритм бинарной классификации:

где - вектор настраиваемых (в процессе обучения) параметров. Как искать вектор - это ключевой вопрос таких задач. На этом занятии мы будем действовать банально, прямолинейно, что называется «в лоб» для нахождения значений компонент вектора . Но вначале поставим следующую задачу.

Предположим, мы хотим создать классификатор, который бы отличал гусениц от божьих коровок по двум результатам измерений: ширины и длины. В итоге, наша обучающая выборка будет состоять из следующих наблюдений:

№	Ширина	Длина	Жук
1	10	50	гусеница
2	20	30	божья коровка
3	25	30	божья коровка
4	20	60	гусеница
5	15	70	гусеница
6	40	40	божья коровка
7	30	45	божья коровка
8	20	45	гусеница
9	40	30	божья коровка
10	7	35	гусеница

Визуально множество измерений располагается, следующим образом:

Здесь красными точками отмечены гусеницы, а синими – божьи коровки. Причем, гусеницам будет соответствовать целевое значение -1, а божьим коровкам – +1. Также видно, что обучающая выборка образует линейно-разделимые классы и разделяющую линию можно провести через начало координат. Поэтому уравнение линии будем искать в виде:

Упростим выражение, перепишем его, следующим образом:

Если принять , то останется только один подбираемый параметр:

А общий вектор:

Фактически, здесь - угловой коэффициент прямой и нам нужно его найти.

Примерно в середине 1950-х годов подобную задачу решал Фрэнк Розенблатт. Он сформулировал критерий качества для разделяющей линии как число неверных классификаций:

Здесь квадратные скобки – это индикатор ошибки, они переводят булевы величины True и False в значения 1 и 0 (нотация Айверсона):

В данном случае, если ответ решающего правила не совпадает с целевым , то формируется значение True, то есть, 1. И, наоборот, при совпадении, будем получать False и значение 0. В итоге, функционал будет подсчитывать число ошибок классификации.

Однако, при решении задач бинарной классификации, когда целевые ответы выбираются из множества , тот же самый показатель качества можно вычислить и так:

Здесь величина будет принимать отрицательные значения при ошибочных классификациях и положительные – при правильных. Действительно, если знаки величин совпадают, значит, мы верно отнесли образ к нужному классу и произведение будет положительным. Иначе, знаки будут различаться, и произведение будет меньше нуля.

Такое произведение очень часто используют при разработке алгоритмов бинарной классификации. Обозначают его большой буквой M:

и называют отступом (в переводе с англ. margin). Эта величина может показывать не только признак верной классификации, но и насколько далеко отстоит образ от разделяющей плоскости.

В нашем случае мы могли бы измерять это расстояние, если убрать знаковую функцию из модели:

Но пока нам это не нужно и мы оставим функцию sign(). Главное здесь запомнить, как вычисляется margin и что он означает. В дальнейшем мы его будем активно использовать.

Итак, критерий качества для решения поставленной задачи сформулирован:

Как нам теперь им воспользоваться, чтобы найти коэффициент ? Очевидно, что чисто математически минимизировать этот функционал невозможно, т.к. он представляет собой кусочно-непрерывную не дифференцируемую функцию. Поэтому решение будет алгоритмическим, подобно тому, что предложил Фрэнк Розенблатт. Я приведу его в виде псевдокода, а затем покажу реализацию на языке Python:

Вход: выборка , шаг обучения , максимальное число итераций N
Выход: вектор весов

1) инициализация

2) повторять N раз

3) поочередно выбирать из обучающей выборки

4) если , то

5) корректировать вес:

6) вычисляем показатель качества

7) если , то прерываем цикл (решение найдено)

Реализацию на Python этой задачи можно посмотреть в файле

machine_learning_6

После запуска программы увидим следующий результат:

Как видите, нам удалось построить разделяющую линию для выборки из двух классов. Конечно, это относительно простая задача. Здесь я лишь хотел показать принцип обучения алгоритма по тренировочной выборке, а также познакомить с понятием отступа (margin) и критерием качества , который нам в дальнейшем пригодится.

Практический курс по ML: https://stepik.org/course/209247/

Решение простой задачи бинарной классификации

Видео по теме