Вопросы и ответы

Каков технический механизм распознавания пользовательского ввода?

Распознавание основано на вычислении семантической близости в векторном пространстве. Пользовательский запрос преобразуется в числовой вектор (embedding), который затем сравнивается с векторами обучающих фраз для каждого намерения и Q&A. Модель определяет наиболее близкое по смыслу намерение. Если вычисленный коэффициент уверенности (confidence score) превышает установленный в настройках проекта порог, распознавание считается успешным.

Почему модель не распознает фразу, семантически близкую к обучающей выборке?

Если модель не распознает фразу, несмотря на наличие похожих примеров, это может быть связано с недостаточной вариативностью обучающей выборки. Для корректного распознавания рекомендуется добавить данную или аналогичные фразы в соответствующее намерение и провести дообучение модели. Также следует убедиться, что порог классификации не установлен на слишком высоком уровне.

Почему бот не реагирует на запрос, если намерение было распознано?

Распознавание намерения — это только первый этап. Для выполнения действия необходимо, чтобы это намерение было привязано к активному сценарию в качестве триггера. Если намерение существует, но не используется ни в одном сценарии, система не будет знать, какое действие выполнить. В таком случае, если это было единственное распознанное намерение, диалог будет переведен на оператора (fallback-сценарий).

Как система обрабатывает орфографические ошибки и опечатки?

Платформа не использует препроцессинг для исправления ошибок в запросе пользователя, чтобы избежать искажения исходного смысла. Вместо этого NLU-модель вычисляет семантический вектор всего предложения, включая опечатки. Этот подход, дополненный тем, что в процессе обучения в кластеры попадают примеры с естественными ошибками, обеспечивает высокую точность распознавания.

Приведет ли установка порога классификации на 100% к улучшению точности?

Нет. Установка порога на 1.0 (100%) приведет к тому, что модель будет распознавать только точные совпадения с обучающей выборкой, теряя способность к генерализации. Это сделает модель нечувствительной к малейшим синонимическим или стилистическим отклонениям. Оптимальное значение порога, как правило, находится в диапазоне 0.7-0.85, что обеспечивает баланс между точностью и способностью к обобщению.

Почему при распознавании нескольких намерений в одном запросе бот отвечает только на одно из них?

Это происходит, если сценарий для первого обработанного намерения содержит шаг, требующий ввода от пользователя (например, блок «Намерение» или «Сущность»). В этом случае диалоговый менеджер переходит в состояние ожидания ответа и приостанавливает выполнение сценариев для остальных распознанных намерений до тех пор, пока текущая ветка диалога не будет завершена.

Каков технологический стек NLU-ядра?

В основе NLU-ядра платформы лежит архитектура BERT (Bidirectional Encoder Representations from Transformers). Для оркестрации компонентов и реализации бизнес-логики используется язык программирования Python.

Какие языки поддерживаются платформой?

Основным языком является русский. По запросу возможна активация поддержки других языков, включая английский, испанский, немецкий, китайский и другие.

Требуются ли навыки программирования для создания сценариев?

Нет. Визуальный редактор сценариев позволяет создавать сложные диалоговые потоки без необходимости написания кода. Навыки программирования (в частности, JavaScript) требуются только для реализации кастомной логики в сниппетах.

В каких отраслях есть успешные кейсы внедрения?

Платформа успешно внедрена и эксплуатируется в различных секторах, включая FoodTech, E-commerce, EdTech, MedTech, кикшеринг, телекоммуникации, такси, маркетплейсы, беттинг и Travel.

Каковы кадровые требования для поддержки проекта?

Для поддержки среднего проекта достаточно одного специалиста для актуализации контента. Для развития проекта и реализации сложной логики могут потребоваться аналитик (для проектирования сценариев) и JS-разработчик (для написания сниппетов).

Какие метрики используются для оценки эффективности?

Ключевые метрики включают: покрытие (доля запросов, на которые бот смог дать ответ), уровень автоматизации (доля диалогов, закрытых без участия оператора), доля нераспознанных запросов и точность распознавания.

Какова максимальная производительность платформы?

Архитектура платформы позволяет горизонтально масштабироваться и выдерживать нагрузку в десятки тысяч сообщений в минуту.

Последнее обновление