# Загрузка аудио

## Как загрузить аудиофайл

1. Откройте раздел **Речевая аналитика**
2. Нажмите кнопку **Загрузить аудио** в верхней части страницы
3. Перетащите файлы в область загрузки или нажмите для выбора
4. Заполните форму метаданных
5. Нажмите **Загрузить**

{% hint style="info" %}
Можно загрузить до **20 файлов** одновременно. Файлы загружаются последовательно с отображением прогресса.
{% endhint %}

## Поддерживаемые форматы

| Формат | Расширение |
| ------ | ---------- |
| MP3    | `.mp3`     |
| WAV    | `.wav`     |
| OGG    | `.ogg`     |
| OPUS   | `.opus`    |
| M4A    | `.m4a`     |
| FLAC   | `.flac`    |

**Максимальный размер файла:** 20 МБ

{% hint style="info" %}
Рекомендуемое качество аудио: 16 kHz, 16-bit, bitrate ≥ 128 kbps для MP3.
{% endhint %}

## Моно и стерео

Система автоматически определяет количество каналов в аудиофайле:

**Стерео (2 канала)** — более точное разделение спикеров:

* Канал 0 = оператор
* Канал 1 = клиент
* Маппинг устанавливается автоматически

**Моно (1 канал)** — разделение спикеров по алгоритму speaker diarization:

* Работает автоматически, без дополнительных настроек

{% hint style="warning" %}
Для многоканального аудио (больше 2 каналов) разделение по спикерам отключается.
{% endhint %}

## Форма метаданных

При загрузке необходимо заполнить следующие поля:

| Поле                   | Обязательное | Описание                                                                |
| ---------------------- | ------------ | ----------------------------------------------------------------------- |
| **Имя менеджера**      | Да           | Имя оператора / менеджера                                               |
| **Имя клиента**        | Да           | Имя клиента                                                             |
| **Направление звонка** | Да           | Входящий (`inbound`) или Исходящий (`outbound`). По умолчанию: входящий |
| **Теги**               | Нет          | Произвольные теги (например: `vip`, `срочно`)                           |

Остальные метаданные генерируются автоматически:

* `interaction_id` — уникальный UUID
* `timestamp` — текущее время
* `recording_mode` — определяется из аудиофайла (mono/stereo)

## Что происходит после загрузки

После загрузки аудиофайл автоматически отправляется на **транскрибацию** (распознавание речи). Этапы:

1. **uploaded** — файл загружен в хранилище
2. **transcribing** — идёт распознавание речи (1–10 минут)
3. **transcribed** — транскрипт готов

{% hint style="warning" %}
LLM-анализ для аудиофайлов **не запускается автоматически**. После завершения транскрибации нужно вручную запустить анализ: выберите звонок в списке, нажмите **Переанализировать** и укажите промпт для голосовых звонков.
{% endhint %}

Чтобы анализ запускался автоматически, настройте пайплайн с привязкой к задаче сбора данных.

{% hint style="info" %}
Для программной загрузки через API используйте эндпоинт `POST /api/v1/speech-analytics/calls/upload/`. Подробнее в разделе [Upload API](https://docs.lia.chat/docs/speech-analytics/zagruzka-audio-api).
{% endhint %}
