Обучение
Лия не обладает способностью к самостоятельному обучению, и это сделано намеренно. Алгоритмы, которые обучаются самостоятельно, часто приводят к ухудшению качества ответа из-за накопления ошибок и включения нерелевантных данных. Без усиленного контроля такие системы могут обучаться на ошибочных примерах, становиться непредсказуемыми и даже некорректными в своих ответах.
Мы решаем эту задачу через полуавтоматический процесс разметки и дообучения. Система классифицирует и кластеризует нераспознанные запросы, а специалисты подтверждают их правильность, добавляют в существующие намерения или создают новые. Такой подход обеспечивает высокую точность и предсказуемость системы, что критически важно для её стабильной и корректной работы.
Далее приведены подробные рекомендации и инструкции по обучению, работе с нераспознанными сообщениями и кластеризацией данных.
Общие рекомендации
Единое предложение без точек
Фразы в намерениях должны быть единым предложением, без точек. Если в середине запроса встречаются точки, вопросительные или восклицательные знаки, их следует убрать и заменить на запятые либо разбить на две обучающие фразы. Точку, вопросительный или восклицательный знак в конце фразы можно оставить.
Очистка от символов и цифр
Из фраз следует убирать все цифры, символы (кроме завершающих знаков препинания), смайлики и даты. В каждом намерении можно оставить 5-6 фраз с цифрами, но не больше — символы имеют большой вес при распознавании, и их обилие ухудшает качество.
Работа с приветствиями
Если во фразе есть приветствие, которое оканчивается точкой, восклицательным знаком или смайликом, удалите его и добавьте в намерение чистую фразу. Приветствие через запятую можно оставить, но не злоупотребляйте таким вариантом.
Компактные фразы
Обучающие фразы не должны быть слишком объёмными. Если сообщение большое, лучше его сократить или разделить на несколько обучающих фраз без потери смысла.
Минимум 8-10 фраз для нового намерения
Формировать новое намерение рекомендуется только в том случае, если есть хотя бы 8-10 фраз, относящихся к нему.
Системное намерение «Символы»
Намерение «Символы» является системным и не подлежит обучению.