Анализ результатов тестирования
После завершения процесса вы увидите детальный отчет. Вот на что нужно обращать внимание:
Общая точность (Test accuracy)
Это самый главный показатель. Он показывает, какой процент примеров из тестового набора был распознан правильно.
Хороший результат: > 90%. Если точность на тестовом наборе близка к точности на тренировочном наборе — это отличный знак, означающий, что модель не переобучилась.
Тревожный сигнал: Если точность на тестовом наборе значительно ниже (например, тренировочная accuracy = 98%, а тестовая = 75%), это явный признак переобучения (overfitting). Модель выучила шумы и особенности тренировочных данных, но не смогла выявить общие закономерности.
Матрица ошибок (Confusion Matrix) для тестовых данных
Это даже важнее, чем общая точность. Она показывает, какие именно классы модель путает между собой на новых данных.
Пример проблемы: Если вы классифицируете животных, и матрица показывает, что модель на тестовых данных часто путает "кошку" с "рысью", это означает:
Этим классам не хватает различительных признаков в данных.
Нужно собрать больше примеров именно для этих двух классов, чтобы помочь модели научиться их различать.
Детальный просмотр отдельных примеров
Вы можете кликнуть на любой пример из тестового набора и посмотреть:
Какой был прогноз модели и с какой уверенностью (confidence).
Какой была истинная метка (ground truth).
Визуализацию данных (например, спектрограмму аудио или само изображение).
Особенно полезно анализировать неправильно классифицированные примеры (они помечены красным цветом). Это помогает понять слабые места модели. не может в достаточной мере предвидеть все возможные обстоятельства.