Загрузка аудио
Аудиозаписи звонков можно загрузить двумя способами:
- Вручную через интерфейс — удобно для быстрых тестов промптов, разового разбора отдельных записей или точечной проверки гипотез. Этот способ описан ниже.
- Автоматически через задачи сбора данных — для постоянного потока из CRM, АТС или мессенджеров. Настраивается в разделе Источники данных и Задачи сбора.
Как загрузить аудиофайл
- Откройте раздел Речевая аналитика
- Нажмите кнопку Загрузить аудио в верхней части страницы
- Перетащите файлы в область загрузки или нажмите для выбора
- Заполните форму метаданных
- Нажмите Загрузить
Можно загрузить до 20 файлов одновременно. Файлы загружаются последовательно с отображением прогресса.
Поддерживаемые форматы
| Формат | Расширение |
|---|---|
| MP3 | .mp3 |
| WAV | .wav |
| OGG | .ogg |
| OPUS | .opus |
| M4A | .m4a |
| FLAC | .flac |
Максимальный размер файла: 20 МБ
Рекомендуемое качество аудио: 16 kHz, 16-bit, bitrate ≥ 128 kbps для MP3.
Моно и стерео
Система автоматически определяет количество каналов в аудиофайле:
Стерео (2 канала) — более точное разделение спикеров:
- Канал 0 = оператор
- Канал 1 = клиент
- Маппинг устанавливается автоматически
Моно (1 канал) — автоматическое разделение спикеров по голосовым признакам:
- Работает автоматически, без дополнительных настроек
Для многоканального аудио (больше 2 каналов) разделение по спикерам отключается.
Форма метаданных
При загрузке необходимо заполнить следующие поля:
| Поле | Обязательное | Описание |
|---|---|---|
| Имя менеджера | Да | Имя оператора / менеджера |
| Имя клиента | Да | Имя клиента |
| Направление звонка | Да | Входящий (inbound) или Исходящий (outbound). По умолчанию: входящий |
| Теги | Нет | Произвольные теги (например: vip, срочно) |
Остальные метаданные генерируются автоматически:
interaction_id— уникальный UUIDtimestamp— текущее времяrecording_mode— определяется из аудиофайла (моно/стерео)
Что происходит после загрузки
После загрузки файл сохраняется со статусом uploaded. Дальнейшая обработка (транскрибация и LLM-анализ) запускается вручную — через пайплайн.
Этапы обработки:
- uploaded — файл загружен в хранилище
- transcribing — идёт распознавание речи (1–10 минут)
- transcribed — транскрипт готов
- analyzing — выполняется LLM-анализ
- completed — обработка завершена
Ни транскрибация, ни LLM-анализ не запускаются автоматически после ручной загрузки. Чтобы обработать загруженные звонки, запустите пайплайн с шагом транскрибации (и при необходимости анализа) — выделите звонки в списке и нажмите Переанализировать либо запустите пайплайн из раздела Пайплайны.
Чтобы обработка запускалась автоматически для новых разговоров, настройте пайплайн с привязкой к задаче сбора данных.
Повторная транскрибация
Транскрибацию можно запускать повторно для уже обработанного звонка — старый транскрипт и реплики автоматически удаляются и заменяются новыми. Это полезно, если первая транскрибация была некачественной или если изменились настройки языка.
Для программной загрузки через API используйте эндпоинт POST /api/v1/speech-analytics/calls/upload/. Подробнее в разделе Upload API.