# Обучение по кластерам

Обучение по кластерам — это процесс дообучения модели на основе групп нераспознанных запросов пользователей. Этот метод позволяет выявлять новые потребности, находить паттерны в неклассифицированных данных и улучшать точность распознавания существующих намерений.

### Принципы работы с кластерами

1. **Приоритизация.** Начинайте работу с верхних кластеров в списке, так как они содержат наиболее частотные и популярные запросы. Это позволяет быстро повысить качество распознавания для значительной части пользователей.
2. **Анализ тематических кластеров.** Большинство кластеров формируются на основе семантической близости (обычно по 3 ключевым словам), поэтому они часто объединяют фразы, относящиеся к одному намерению. Такие кластеры можно целиком добавлять в существующее или новое намерение, предварительно проверив их на наличие нерелевантных фраз.
3. **Обработка крупных общих кластеров.** Кластеры `0` и `1`, как правило, содержат большое количество разнородных запросов. Их полный разбор нецелесообразен. Вместо этого используйте поиск по ключевым словам для выявления и извлечения из них более мелких тематических групп.

### Обработка особых случаев

* **Исключение неинформативных кластеров.** Кластеры, состоящие исключительно из персональных данных (ФИО, номера телефонов, адреса), ссылок, дат или смайликов, не используются для обучения, так как не несут семантической нагрузки для определения намерения.
* **Анализ контекстно-зависимых запросов.** Фразы вроде «И что делать?», «Не получается» или «Как быть?» требуют анализа контекста диалога. Изучите предыдущие сообщения бота, чтобы понять причину возникновения таких запросов. Возможные решения:
  * **Оптимизация сценария:** Измените текст или логику ответа бота, если текущая версия вводит пользователя в заблуждение.
  * **Создание вспомогательного намерения:** Сформируйте из этих фраз отдельное намерение и интегрируйте его в сценарий для обработки подобных ситуаций (например, для уточнения вопроса или перевода на оператора).
