Машинное обучение вики
Advertisement

 AUC-ROC[]

При прогнозировании вероятности чем больший мы можем получить TPR при меньшем FPR, тем лучше качество классификатора. Поэтому можем ввести следующую метрику, оценивающую качество работы классификатора, вычисляющего вероятность принадлежности объекта к положительному классу:

.

Это значение является площадью под графиком ROC-кривой (area under curve, AUC).

  • .
  • значит классификатор идеально разделяет классы.
  • классификатор с эквивалентен классификатору который оценивает вероятность принадлежности объекта к положительному классу как случайное число от до (равномерно распределенное, и никак не зависящее от ) . Отсюда если то классификатор предсказывает класс объекта лучше чем (здесь имеется в виду, что и возвращают вероятность принадлежности к положительному классу).
  • AUC равен вероятности того что случайно выбранный объект положительного класса окажется в отсортированном списке правее случайно выбранного объекта отрицательного класса.

Пусть классификатор выдает на выборке вероятности соответственно. Отсортируем вероятности в порядке возрастания: , и этим вероятностям соответствуют объекты и метки классов соответственно. Тогда можно вывести следующую формулу для вычисления AUC-ROC метрики на практике:

, где — количество объектов положительного и отрицательного классов соответственно.

Advertisement