Загрузка аудио

Аудиозаписи звонков можно загрузить двумя способами:

Вручную через интерфейс — удобно для быстрых тестов промптов, разового разбора отдельных записей или точечной проверки гипотез. Этот способ описан ниже.
Автоматически через задачи сбора данных — для постоянного потока из CRM, АТС или мессенджеров. Настраивается в разделе Источники данных и Задачи сбора.

Как загрузить аудиофайл

Откройте раздел Лия Sense
Нажмите кнопку Загрузить аудио в верхней части страницы
Перетащите файлы в область загрузки или нажмите для выбора
Заполните форму метаданных
Нажмите Загрузить

к сведению

Можно загрузить до 20 файлов одновременно. Файлы загружаются последовательно с отображением прогресса.

Поддерживаемые форматы

Формат	Расширение
MP3	`.mp3`
WAV	`.wav`
OGG	`.ogg`
OPUS	`.opus`
M4A	`.m4a`
FLAC	`.flac`

Максимальный размер файла: 20 МБ

к сведению

Рекомендуемое качество аудио: 16 kHz, 16-bit, bitrate ≥ 128 kbps для MP3.

Моно и стерео

Система автоматически определяет количество каналов в аудиофайле:

Стерео (2 канала) — более точное разделение спикеров:

Канал 0 = оператор
Канал 1 = клиент
Маппинг устанавливается автоматически

Моно (1 канал) — автоматическое разделение спикеров по голосовым признакам:

Работает автоматически, без дополнительных настроек

warning

Для многоканального аудио (больше 2 каналов) разделение по спикерам отключается.

Форма метаданных

При загрузке необходимо заполнить следующие поля:

Поле	Обязательное	Описание
Имя менеджера	Да	Имя оператора / менеджера
Имя клиента	Да	Имя клиента
Направление звонка	Да	Входящий (`inbound`) или Исходящий (`outbound`). По умолчанию: входящий
Теги	Нет	Произвольные теги (например: `vip`, `срочно`)

Остальные метаданные генерируются автоматически:

interaction_id — уникальный UUID
timestamp — текущее время
recording_mode — определяется из аудиофайла (моно/стерео)

Что происходит после загрузки

После загрузки файл сохраняется со статусом uploaded. Дальнейшая обработка (транскрибация и LLM-анализ) запускается вручную — через пайплайн.

Этапы обработки:

uploaded — файл загружен в хранилище
transcribing — идёт распознавание речи (1–10 минут)
transcribed — транскрипт готов
analyzing — выполняется LLM-анализ
completed — обработка завершена

warning

Ни транскрибация, ни LLM-анализ не запускаются автоматически после ручной загрузки. Чтобы обработать загруженные звонки, запустите пайплайн с шагом транскрибации (и при необходимости анализа) — выделите звонки в списке и нажмите Переанализировать либо запустите пайплайн из раздела Пайплайны.

Чтобы обработка запускалась автоматически для новых разговоров, настройте пайплайн с привязкой к задаче сбора данных.

Повторная транскрибация

Транскрибацию можно запускать повторно для уже обработанного звонка — старый транскрипт и реплики автоматически удаляются и заменяются новыми. Это полезно, если первая транскрибация была некачественной или если изменились настройки языка.

к сведению

Для программной загрузки через API используйте эндпоинт POST /api/v1/speech-analytics/calls/upload/. Подробнее в разделе Upload API.

Как загрузить аудиофайл​

Поддерживаемые форматы​

Моно и стерео​

Форма метаданных​

Что происходит после загрузки​

Повторная транскрибация​

Как загрузить аудиофайл

Поддерживаемые форматы

Моно и стерео

Форма метаданных

Что происходит после загрузки

Повторная транскрибация