Speech Analytics API
Обзор
API для загрузки аудиозаписей звонков и автоматического запуска их транскрибации и анализа с помощью ИИ.
После загрузки файл автоматически:
✅ Загружается в облачное хранилище
✅ Отправляется на транскрибацию
✅ Анализируется с помощью LLM
✅ Классифицируется по намерениям и сущностям
Endpoint
POST /api/v1/speech-analytics/calls/upload/Аутентификация
Требуется токен авторизации в заголовке:
Authorization: Bearer <your_token>Параметры запроса
Content-Type
multipart/form-dataОбязательные поля
audio_file
File
Аудиофайл звонка
project
Integer
ID проекта (для определения схемы метаданных)
metadata
JSON
Метаданные звонка в формате JSON
Форматы аудио
Поддерживаемые форматы:
✅ MP3
✅ WAV
✅ OGG
✅ OPUS
✅ M4A
✅ FLAC
Ограничения:
Максимальный размер файла: 20 МБ
Рекомендуемое качество: 16 kHz, 16-bit
Для стерео: канал 0 = менеджер, канал 1 = клиент
Структура метаданных
Обязательные поля
interaction_id(string) - Уникальный идентификатор звонкаchannel(string) - Канал коммуникации:"voice","chat","email"и т.д.timestamp(string ISO 8601) - Время звонка
Примеры запросов
Ответ сервера
Поля ответа
id
Integer
ID созданного звонка
audio_file_uuid
UUID
Уникальный идентификатор файла
audio_file_name
String
Имя загруженного файла
status
String
Статус обработки (см. ниже)
metadata
Object
Сохраненные метаданные
created_at
DateTime
Время создания записи
message
String
Информационное сообщение
Статусы обработки
После загрузки звонок проходит через следующие статусы:
uploaded
✅ Файл загружен в S3
1-5 сек
transcribing
🔄 Идет транскрибация аудио
1-10 мин
transcribed
✅ Транскрибация завершена
-
analyzing
🔄 Идет анализ с помощью LLM
10-60 сек
completed
✅ Обработка завершена полностью
-
failed
❌ Ошибка обработки
-
Опрос статуса:
GET /api/v1/speech-analytics/calls/{id}/Ошибки
Лучшие практики
Получение результатов
Опрос статуса
curl -X GET "https://api.example.com/api/v1/speech-analytics/calls/12345/" \
-H "Authorization: Bearer YOUR_TOKEN"Последнее обновление