Перейти к основному содержимому

Загрузка аудио

Аудиозаписи звонков можно загрузить двумя способами:

  • Вручную через интерфейс — удобно для быстрых тестов промптов, разового разбора отдельных записей или точечной проверки гипотез. Этот способ описан ниже.
  • Автоматически через задачи сбора данных — для постоянного потока из CRM, АТС или мессенджеров. Настраивается в разделе Источники данных и Задачи сбора.

Как загрузить аудиофайл

  1. Откройте раздел Речевая аналитика
  2. Нажмите кнопку Загрузить аудио в верхней части страницы
  3. Перетащите файлы в область загрузки или нажмите для выбора
  4. Заполните форму метаданных
  5. Нажмите Загрузить
к сведению

Можно загрузить до 20 файлов одновременно. Файлы загружаются последовательно с отображением прогресса.

Поддерживаемые форматы

ФорматРасширение
MP3.mp3
WAV.wav
OGG.ogg
OPUS.opus
M4A.m4a
FLAC.flac

Максимальный размер файла: 20 МБ

к сведению

Рекомендуемое качество аудио: 16 kHz, 16-bit, bitrate ≥ 128 kbps для MP3.

Моно и стерео

Система автоматически определяет количество каналов в аудиофайле:

Стерео (2 канала) — более точное разделение спикеров:

  • Канал 0 = оператор
  • Канал 1 = клиент
  • Маппинг устанавливается автоматически

Моно (1 канал) — автоматическое разделение спикеров по голосовым признакам:

  • Работает автоматически, без дополнительных настроек
warning

Для многоканального аудио (больше 2 каналов) разделение по спикерам отключается.

Форма метаданных

При загрузке необходимо заполнить следующие поля:

ПолеОбязательноеОписание
Имя менеджераДаИмя оператора / менеджера
Имя клиентаДаИмя клиента
Направление звонкаДаВходящий (inbound) или Исходящий (outbound). По умолчанию: входящий
ТегиНетПроизвольные теги (например: vip, срочно)

Остальные метаданные генерируются автоматически:

  • interaction_id — уникальный UUID
  • timestamp — текущее время
  • recording_mode — определяется из аудиофайла (моно/стерео)

Что происходит после загрузки

После загрузки файл сохраняется со статусом uploaded. Дальнейшая обработка (транскрибация и LLM-анализ) запускается вручную — через пайплайн.

Этапы обработки:

  1. uploaded — файл загружен в хранилище
  2. transcribing — идёт распознавание речи (1–10 минут)
  3. transcribed — транскрипт готов
  4. analyzing — выполняется LLM-анализ
  5. completed — обработка завершена
warning

Ни транскрибация, ни LLM-анализ не запускаются автоматически после ручной загрузки. Чтобы обработать загруженные звонки, запустите пайплайн с шагом транскрибации (и при необходимости анализа) — выделите звонки в списке и нажмите Переанализировать либо запустите пайплайн из раздела Пайплайны.

Чтобы обработка запускалась автоматически для новых разговоров, настройте пайплайн с привязкой к задаче сбора данных.

Повторная транскрибация

Транскрибацию можно запускать повторно для уже обработанного звонка — старый транскрипт и реплики автоматически удаляются и заменяются новыми. Это полезно, если первая транскрибация была некачественной или если изменились настройки языка.

к сведению

Для программной загрузки через API используйте эндпоинт POST /api/v1/speech-analytics/calls/upload/. Подробнее в разделе Upload API.