Мера производительности для моделей классификации

Для задач регрессии точность модели обычно измеряется как разница между фактическими значениями и прогнозируемыми значениями, но в модели классификации точность модели обычно измеряется путем создания матрицы путаницы и проверки различных показателей с использованием матрицы путаницы.

Для оценки моделей классификации используются следующие метрики:

Точность
Отзывать
Точность
Оценка F1
Специфика
РПЦ
АУК

Давайте рассмотрим каждый из них подробно.

Матрица путаницы

Скажем, для классификации классов A и B всех пар A/B матрица путаницы используется для подсчета количества раз, когда экземпляры класса A классифицируются как класс B.
Для создания матрицы путаницы нам необходимо иметь набор правильных и неправильных предикатов для каждого класса.

Где

TP (True Positive), что означает, что наблюдение положительное, а прогноз также положительный.

TN (True Negative), что означает, что наблюдение отрицательное, а прогнозируемое значение также отрицательное.

FP (ложное срабатывание), что означает, что наблюдение отрицательное, но прогнозируемое значение положительное.

FN (ложноотрицательный результат), что означает, что наблюдение положительное, но прогнозируемое значение отрицательное.

Давайте рассмотрим пример, чтобы понять, как создать матрицу путаницы.

Пример 1: Рассмотрим модель классификации, которая должна определять, страдает ли человек диабетом или нет, из группы из 100 человек. И у нас есть с собой фактические значения и прогнозируемые модели. Модель предсказала, что из 100 35 человек страдают диабетом, у которых на самом деле наблюдается диабет, который можно назвать истинно положительным, и 30 - как недиабетические, тогда как они являются диабетиками, что является ложноотрицательным, и 15 человек - диабетическими, хотя на самом деле они не являются диабетическими. диабетический, который является ложноположительным, и 20 как недиабетические, которые на самом деле являются недиабетическими, что является истинно отрицательным, поэтому мы можем обобщить их следующим образом:

TP — 35

FN — 30

FP — 15

TN — 20

Теперь матрицу путаницы можно представить как

Пример 2: Давайте рассмотрим пример, в котором модель должна классифицировать, является ли электронное письмо спамом или нет. Из 50 электронных писем модель предсказала, что 10 электронных писем являются спамом, которые на самом деле рассматриваются как спам, поэтому истинно положительным считается 10 и 5 электронных писем помечены. как спам в прогнозе по модели, где, как они наблюдаются, как не спам-сообщения, поэтому здесь ложноотрицательное значение равно 5, а 15 электронные письма помечаются как не спам по модели, где, как считается, они являются спамом, поэтому ложноположительное значение равно 15, а остальные электронные письма помечаются как спам, и на самом деле они рассматриваются как спам, поэтому True Negative равен 20. Если суммировать приведенные выше прогнозы, мы можем сказать, что

TP — 10

FN — 5

FP — 15

TN — 20

Теперь матрицу путаницы можно представить в виде