Начало работы
Быстрый старт
Чтобы начать использовать Речевую аналитику, выполните три шага:
1. Создайте промпт
Промпт — это инструкция для LLM, определяющая, что именно нужно анализировать в разговорах. Перейдите в раздел Промпты и создайте новую версию промпта:
- Выберите провайдера LLM (OpenAI, Anthropic, YandexGPT или GigaChat)
- Выберите модель
- Напишите системный промпт или используйте автогенерацию из текстового описания
- Задайте JSON-схему ожидаемого результата
- Активируйте промпт
Для голосовых звонков и текстовых диалогов используются отдельные активные промпты. Убедитесь, что активировали промпт для нужного типа разговоров.
2. Загрузите данные
Есть несколько способов загрузки:
- Аудиофайл — загрузите запись звонка (MP3, WAV, OGG, OPUS, M4A, FLAC). Система автоматически транскрибирует аудио и запустит анализ.
- CSV/JSON — импортируйте текстовые диалоги из файла.
- Источник данных — подключите внешнюю систему для автоматического сбора.
3. Просмотрите результаты
После завершения обработки откройте разговор в списке, чтобы увидеть:
- Транскрипт с разделением по спикерам (для звонков)
- Результаты LLM-анализа в виде виджетов
- Метаданные и метрики качества
Подробнее о просмотре разговоров
Жизненный цикл обработки
Голосовые звонки
После загрузки аудиофайл проходит следующие этапы:
| Статус | Описание |
|---|---|
uploaded | Файл загружен в хранилище |
transcribing | Идёт транскрибация (распознавание речи) |
transcribed | Транскрибация завершена |
analyzing | Идёт LLM-анализ |
completed | Обработка завершена |
failed | Ошибка на одном из этапов |
Текстовые диалоги
| Статус | Описание |
|---|---|
imported | Диалог импортирован |
analyzing | Идёт LLM-анализ |
completed | Анализ завершён |
failed | Ошибка анализа |
Транскрибация аудио может занимать от 1 до 10 минут в зависимости от длительности записи. LLM-анализ обычно занимает 10–60 секунд.
Поддерживаемые форматы аудио
| Формат | Расширение |
|---|---|
| MP3 | .mp3 |
| WAV | .wav |
| OGG | .ogg |
| OPUS | .opus |
| M4A | .m4a |
| FLAC | .flac |
Ограничения:
- Максимальный размер файла: 20 МБ
- Рекомендуемое качество: 16 kHz, 16-bit
- Для стерео: канал 0 = оператор (agent), канал 1 = клиент
Типы разговоров
Модуль работает с двумя типами разговоров:
| Тип | Описание | Источник |
|---|---|---|
| Голосовые звонки (voice) | Аудиозаписи телефонных разговоров | Загрузка аудио, внешние источники |
| Текстовые диалоги (text) | Чаты из мессенджеров, CRM, виджетов | Импорт CSV/JSON, внешние источники |
Оба типа отображаются в едином списке разговоров и анализируются одинаковым образом, но для каждого типа настраивается отдельный активный промпт.