Перейти к основному содержимому

Начало работы

Быстрый старт

Чтобы начать использовать Речевую аналитику, выполните три шага:

1. Создайте промпт

Промпт — это инструкция для LLM, определяющая, что именно нужно анализировать в разговорах. Перейдите в раздел Промпты и создайте новую версию промпта:

  • Выберите провайдера LLM (OpenAI, Anthropic, YandexGPT или GigaChat)
  • Выберите модель
  • Напишите системный промпт или используйте автогенерацию из текстового описания
  • Задайте JSON-схему ожидаемого результата
  • Активируйте промпт
к сведению

Для голосовых звонков и текстовых диалогов используются отдельные активные промпты. Убедитесь, что активировали промпт для нужного типа разговоров.

Подробнее о промптах

2. Загрузите данные

Есть несколько способов загрузки:

  • Аудиофайл — загрузите запись звонка (MP3, WAV, OGG, OPUS, M4A, FLAC). Система автоматически транскрибирует аудио и запустит анализ.
  • CSV/JSON — импортируйте текстовые диалоги из файла.
  • Источник данных — подключите внешнюю систему для автоматического сбора.

Подробнее о загрузке

3. Просмотрите результаты

После завершения обработки откройте разговор в списке, чтобы увидеть:

  • Транскрипт с разделением по спикерам (для звонков)
  • Результаты LLM-анализа в виде виджетов
  • Метаданные и метрики качества

Подробнее о просмотре разговоров


Жизненный цикл обработки

Голосовые звонки

После загрузки аудиофайл проходит следующие этапы:

СтатусОписание
uploadedФайл загружен в хранилище
transcribingИдёт транскрибация (распознавание речи)
transcribedТранскрибация завершена
analyzingИдёт LLM-анализ
completedОбработка завершена
failedОшибка на одном из этапов

Текстовые диалоги

СтатусОписание
importedДиалог импортирован
analyzingИдёт LLM-анализ
completedАнализ завершён
failedОшибка анализа
warning

Транскрибация аудио может занимать от 1 до 10 минут в зависимости от длительности записи. LLM-анализ обычно занимает 10–60 секунд.


Поддерживаемые форматы аудио

ФорматРасширение
MP3.mp3
WAV.wav
OGG.ogg
OPUS.opus
M4A.m4a
FLAC.flac

Ограничения:

  • Максимальный размер файла: 20 МБ
  • Рекомендуемое качество: 16 kHz, 16-bit
  • Для стерео: канал 0 = оператор (agent), канал 1 = клиент

Типы разговоров

Модуль работает с двумя типами разговоров:

ТипОписаниеИсточник
Голосовые звонки (voice)Аудиозаписи телефонных разговоровЗагрузка аудио, внешние источники
Текстовые диалоги (text)Чаты из мессенджеров, CRM, виджетовИмпорт CSV/JSON, внешние источники

Оба типа отображаются в едином списке разговоров и анализируются одинаковым образом, но для каждого типа настраивается отдельный активный промпт.