Обучение по кластерам
Кластеры содержат в себе только те запросы, которые Лия не смогла распознать, поэтому их все можно брать в обучение.
Обучение на кластерах следует начинать с самых верхних: в них содержатся наиболее популярные запросы.
Как правило, кластеры 0 и 1 содержат в себе очень много запросов разного вида. Целиком разбирать их зачастую не имеет смысла, но иногда из них можно выделить определенные интенты (удобнее всего это делать через поиск по ключевым словам).
Кластеры формируются по 3 ключевым словам, поэтому в одном кластере чаще всего находятся фразы, которые относятся к одному интенту (существующему или потенциально новому). Такие кластеры можно брать в дообучение целиком, но стоит проверить, нет ли в них фраз, которые содержат в себе другой смысл. Такие фразы нужно убрать перед добавлением кластера в проект.
Могут встречаться кластеры, которые содержат в себе исключительно номера телефонов, адреса, смайлики, даты и время, ссылки, ФИО. Их в работу не берем.
Если в кластерах встречаются запросы без уточнения, например: «И что делать?», «Как быть?», «Не могу», «Ничего не выходит», «Там пусто» — следует изучить диалоги и посмотреть, в каких сценариях пользователь пишет подобные сообщения после ответа Лии. Далее можно либо поменять текстовку (если в ходе анализа мы видим, что пользователю она не помогает), либо сформировать вспомогательный интент из данных фраз и поместить его в середину сценария, чтобы отлавливать такие случаи и задавать уточняющие вопросы / решать проблему через оператора.
Last updated