Метрики оценки производительности в машинном обучении
В машинном обучении показатели оценки производительности используются для расчета производительности ваших обученных моделей машинного обучения. Это помогает определить, насколько лучше ваша модель машинного обучения может работать с набором данных, которого она никогда раньше не видела. Если вы никогда не использовали какие-либо показатели оценки производительности для оценки производительности своей модели машинного обучения, то эта статья для вас. В этой статье я познакомлю вас с некоторыми из лучших показателей оценки производительности в машинном обучении.
Метрики оценки производительности
В машинном обучении метрика оценки производительности играет очень важную роль в определении производительности нашей модели машинного обучения для набора данных, который она никогда раньше не видела. Скорее всего, модель, которую вы обучили, всегда будет лучше работать с набором данных, на котором вы ее обучили. Но мы обучаем модели машинного обучения хорошо работать при решении реальных проблем, когда данные передаются непрерывно. Если мы используем модель, которая недостаточно подходит для хорошей работы, нет смысла использовать машинное обучение для решения ваших проблем. Вот здесь-то и появляются метрики оценки производительности. Метрика оценки производительности определяет, будет ли ваша обученная модель машинного обучения хорошо справляться с решением проблемы, для которой она была обучена, или нет.
Существует множество показателей оценки производительности, которые вы можете использовать для измерения производительности ваших моделей машинного обучения для классификации, а также для регрессии. Ниже представлены некоторые из лучших показателей оценки производительности, которые я рекомендую вам использовать для оценки производительности вашей модели машинного обучения. Все упомянутые ниже показатели оценки производительности решаются и объясняются с помощью языка программирования Python.
Оценка R2:
Оценка R2 – очень важный показатель, который используется для оценки производительности модели машинного обучения на основе регрессии. Он произносится как R в квадрате и также известен как коэффициент детерминации. Он работает, измеряя количество отклонений в прогнозах, объясненных набором данных. Проще говоря, это разница между выборками в наборе данных и прогнозами, сделанными моделью. Здесь вы можете найти учебное пособие по этой теме.
Объясненная дисперсия:
Объясненная дисперсия используется для измерения доли изменчивости прогнозов модели машинного обучения. Проще говоря, это разница между ожидаемым значением и прогнозируемым значением. Концепция объясненной дисперсии очень важна для понимания того, сколько информации мы можем потерять, сверяя набор данных. Здесь вы можете найти учебное пособие по этой теме.
Матрица неточностей:
Матрица неточностей – это метод оценки эффективности модели классификации. Идея состоит в том, чтобы подсчитать, сколько раз экземпляры класса 1 классифицируются как класс 2. Например, чтобы узнать, сколько раз модель классификации путала изображения собаки с кошкой, вы используете матрицу неточностей. Здесь вы можете найти учебное пособие по этой теме.
Отчет о классификации:
Отчет о классификации – это один из показателей оценки эффективности модели машинного обучения на основе классификации. Он отображает точность вашей модели, отзывчивость, оценку F1 и поддержку. Он обеспечивает лучшее понимание общей производительности нашей обученной модели. Чтобы понять суть отчета о классификации модели машинного обучения, вам необходимо знать все показатели, отображаемые в отчете. Для более четкого понимания я объяснил все показатели ниже, чтобы вы могли легко понять отчет о классификации вашей модели машинного обучения:
- Точность: Точность определяется как отношение истинных положительных результатов к сумме истинных и ложных классификаций.
- Отзыв: отзыв определяется как отношение истинных положительных результатов к сумме истинно положительных и ложно отрицательных результатов.
- Оценка F1: F1 – это взвешенное среднее гармоническое значение точности и запоминания. Чем ближе значение показателя F1 к 1,0, тем выше ожидаемая производительность модели.
- Поддержка: Поддержка – это количество фактических вхождений класса в набор данных. Для разных моделей она не отличается, а просто диагностирует процесс оценки эффективности.
Здесь вы можете найти учебное пособие по этой теме.
Резюме
Итак, это – одни из лучших показателей оценки производительности, которые вы можете использовать для измерения производительности вашей модели машинного обучения. В машинном обучении метрика оценки производительности играет очень важную роль в определении производительности нашей модели машинного обучения для набора данных, который она никогда раньше не видела. Надеюсь, вам понравилась эта статья о показателях оценки эффективности в машинном обучении. Не стесняйтесь задавать свои вопросы в разделе комментариев ниже.