Перейти к основному содержимому

Глоссарий

База знаний (Knowledge Base)

Система хранения и поиска документов организации. Индексирует загруженные файлы и обеспечивает семантический поиск, дополняя ответы LLM фактами из документов.

Векторная база (Vector Store)

Хранилище эмбеддингов с поиском по сходству векторов. Платформа использует Qdrant; коллекция изолирована на уровне организации.

Воркфлоу (Workflow)

Визуальный конвейер из нод, реализующий AI-логику без написания кода. Воркфлоу собирается на холсте редактора, выполняется по связям между нодами и поддерживает версионирование.

Выполнение (Execution)

Один запуск воркфлоу. Имеет жизненный цикл: Queued → Running → Completed / Failed / Cancelled / Interrupted. Доступно для просмотра в трассировке.

Голосовой агент (Voice Agent)

AI-ассистент, обрабатывающий речь в режиме реального времени. Принимает аудио на вход, отвечает голосом и работает по каналам Web (WebRTC), SIP или MMD.

Делегирование (Handoff)

Передача управления диалогом от одного агента другому в мульти-агентной архитектуре. Реализована по паттерну Swarm через инструмент `transfer_to_colleague` с передачей контекста.

Задача (Task)

Follow-up действие, создаваемое агентом, пользователем, воркфлоу или через API: напоминание, поручение сотруднику или автозапуск процесса. Поддерживает cron-расписание и доставку результата (в тред, webhook).

Инструмент (Tool)

Возможность, которую агент может вызвать во время разговора: пользовательская функция, MCP-инструмент, воркфлоу, поиск по базе знаний, веб-браузер или операции с памятью.

Источник (Source)

Файл или папка из подключённого хранилища, выбранные для индексации. Источники привязываются к коннектору и пайплайну, могут синхронизироваться по расписанию.

Коннектор (Connector)

Подключение к внешнему хранилищу данных, из которого база знаний загружает документы. Поддерживаемые типы: S3, Google Cloud Storage, Azure Blob Storage, локальное хранилище.

Нода (Node)

Минимальный строительный блок воркфлоу. Каждая нода выполняет одну операцию: вызов агента, HTTP-запрос, ветвление, обращение к базе знаний и т.д. Ноды соединяются связями (edges).

Обработка ошибок

Глобальные настройки воркфлоу для повторных попыток. Ошибки делятся на три категории:

  • Повторяемые (retryable) — таймауты, rate limit, сетевые ошибки.
  • Исправляемые (correctable) — валидация, парсинг JSON; модель пытается исправить ответ.
  • Фатальные (fatal) — ошибки аутентификации и конфигурации; останавливают выполнение.

Организация (Organization)

Верхний уровень иерархии в платформе. Объединяет проекты, пользователей, API-ключи, базу знаний, тарифный план и интеграции. Все ресурсы изолированы между организациями.

Пайплайн (Pipeline)

Цепочка узлов обработки в базе знаний. Бывает двух типов:

  • Ingestion — индексация: парсинг, чанкинг, эмбеддинг, сохранение в Vector Store.
  • Retrieval — поиск: эмбеддинг запроса, векторный поиск, переранжирование.

Память агента (Memory)

Долгосрочное хранилище фактов, доступное агенту между разговорами. Имеет четыре области:

  • thread — в рамках одного диалога.
  • user — личная память пользователя во всех его разговорах.
  • project — общая память для всех агентов проекта.
  • organization — общая память на уровне организации.

Переменная (Variable)

Именованное значение в состоянии воркфлоу. Доступно через синтаксис `{{имя}}`: `{{input}}` (входные данные), `{{lastOutput}}` (результат предыдущей ноды), `{{node_X}}` (результат ноды по ID).

Подтверждение (Approval)

Механизм human-in-the-loop, приостанавливающий воркфлоу до решения человека. Создаётся нодой «Подтверждение»; имеет статусы Pending, Approved, Rejected, Timeout.

Прерывание (Interruption)

Ситуация, когда пользователь начинает говорить во время реплики агента. Параметры `Min Interruption Duration` и `False Interruption Timeout` определяют, реагировать ли агенту на короткие звуки как на прерывание.

Проект (Project)

Рабочее пространство внутри организации, в котором создаются и хранятся воркфлоу, агенты, функции, MCP-серверы и публикации. Имеет собственный API-ключ и часовой пояс.

Публикация (Publication)

Неизменяемый снапшот проекта (воркфлоу, агенты, функции, MCP-серверы), доступный по публичному API. Имеет номер версии; в каждый момент активна только одна публикация.

Публичный API (Published API)

Внешний REST API для запуска опубликованных воркфлоу. Аутентификация через API-ключ проекта в заголовке `Authorization: Bearer`. Поддерживает синхронные вызовы и SSE-стриминг.

Режимы голосового агента

Два подхода к обработке голоса:

  • Pipeline — последовательный конвейер STT → LLM → TTS с выбором провайдера для каждого этапа. Максимальная гибкость.
  • Realtime — прямая обработка audio-to-audio через API реального времени (OpenAI, Google, xAI). Минимальная задержка.

Роли агента

Определяют поведение агента в мульти-агентной архитектуре:

  • Самостоятельный (Standalone) — работает автономно, без делегирования. Роль по умолчанию.
  • Оркестратор (Orchestrator) — координирует команду, принимает запросы и передаёт их специалистам.
  • Специалист (Specialist) — отвечает за определённую область, получает задачи от оркестратора.

Связь (Edge)

Соединение между выходом одной ноды и входом другой, определяющее порядок выполнения. У ветвящихся нод (If/Else, Guardrails, Подтверждение) несколько именованных выходов.

Сессия (Session)

Один разговор с голосовым агентом. Имеет статус (active/completed/failed/abandoned), длительность, канал связи, транскрипт реплик и метрики производительности.

Системный промпт (System Prompt)

Главная инструкция, определяющая поведение агента: его роль, задачи, ограничения и формат ответа. Поддерживает подстановку переменных вида `{{имя}}` и шаблоны Jinja2.

Снапшот (Snapshot)

Зафиксированное состояние всех компонентов проекта в момент создания публикации. Не изменяется при последующем редактировании проекта; обеспечивает стабильность API.

Состояние (State)

Общее хранилище данных воркфлоу во время выполнения. Содержит входные данные, результат каждой ноды и пользовательские переменные, передаваемые между нодами.

Суб-агент (Sub-agent)

Агент-коллега, подключённый к другому агенту для делегирования задач. Один агент может иметь до 10 коллег, максимальная глубина передач — 5 уровней.

Текстовый агент (Text Agent)

AI-ассистент, общающийся с пользователем в текстовом формате. Использует выбранную LLM, может вызывать инструменты, обращаться к базе знаний, использовать память и делегировать задачи другим агентам.

Температура (Temperature)

Параметр LLM, регулирующий случайность генерации. Низкие значения (0) дают детерминированные ответы, высокие (до 2) — более творческие и непредсказуемые. По умолчанию 0.7.

Тихий режим (Silent Mode)

Опция ноды воркфлоу, при которой её вывод не транслируется в SSE-поток. Полезно для промежуточных нод, результат которых не нужно показывать пользователю.

Трассировка (Tracing)

Раздел для просмотра, фильтрации и анализа выполнений. Показывает таймлайн событий сессии, детали каждого шага, вызовы инструментов и метрики производительности.

Тред (Thread)

Поток выполнения, объединяющий несколько запусков воркфлоу в одну сессию. Идентифицируется через `ThreadId`; в рамках одного треда сохраняется история диалога и контекст агента.

Филлер (Filler / Hesitation)

Короткое аудио-вкрапление («угу», «хмм», «дайте подумать…»), которое голосовой агент воспроизводит во время ожидания LLM или backchannel-реакции. Генерируется автоматически в голосе агента.

Функция (Function)

Пользовательский JavaScript-скрипт, расширяющий возможности агентов и воркфлоу. Имеет имя, описание, JSON Schema параметров и таймаут от 1 до 60 секунд. Подключается как инструмент или используется в ноде «Функция».

Холст (Canvas)

Интерактивная рабочая область визуального редактора, на которой располагаются ноды и связи воркфлоу. Поддерживает перетаскивание, масштабирование, мини-карту и автолэйаут.

Чанк (Chunk)

Фрагмент документа, полученный при разбиении исходного текста. Каждый чанк индексируется отдельно. Ключевые параметры — `chunk_size` (размер) и `chunk_overlap` (перекрытие соседних чанков).

Шаблон промпта (Prompt Template)

Редактируемый блок текста с поддержкой Jinja2-синтаксиса, из которого собирается финальный системный промпт агента. Поддерживает переменные, условия, циклы и историю версий.

Шаг (Step)

Единица выполнения внутри одного запуска воркфлоу — обработка одной ноды. Каждый шаг имеет входные/выходные данные, статус, длительность и порядковый номер.

Эмбеддинг (Embedding)

Числовой вектор фиксированной размерности, представляющий смысл текстового фрагмента. Используется для семантического поиска: близкие по смыслу тексты дают близкие векторы.

API-ключ (API Key)

Секретный токен для аутентификации запросов: либо ключ провайдера LLM/STT/TTS на уровне организации, либо ключ проекта для публичного API. Имеет уровни доступа (scopes) и может быть отозван.

Cron-выражение (Cron Expression)

Строка, описывающая периодическое расписание (например, `0 9 * * 1-5`). Используется для повторяющихся задач и автоматического запуска воркфлоу с учётом часового пояса.

Dispatch Rule (Правило маршрутизации)

Правило, определяющее, какой голосовой агент обрабатывает входящий SIP-звонок. Привязывается к транкам и создаёт LiveKit-комнату для каждого вызова.

Guardrails (Модерация)

Нода, выполняющая LLM-проверку контента по заданным правилам. Возвращает JSON с полями `passed` и `violations`, направляет поток по веткам «Пройдено» или «Не пройдено».

JSON Schema

Формальное описание структуры JSON-объекта, используемое для параметров функций и формата вывода агента. В strict-режиме OpenAI требует `additionalProperties: false`.

LLM (Large Language Model)

Большая языковая модель, генерирующая текст по запросу. Платформа поддерживает модели OpenAI, Anthropic, xAI, Google, Yandex, GigaChat и другие через подключаемых провайдеров.

MCP (Model Context Protocol)

Открытый протокол для стандартизированного подключения AI-моделей к внешним сервисам. Позволяет агенту использовать инструменты внешних систем без написания кода интеграции.

MCP-сервер (MCP Server)

Внешний HTTP-сервис, предоставляющий набор инструментов через протокол Model Context Protocol. Платформа автоматически обнаруживает и подключает инструменты сервера, передавая учётные данные при каждом вызове.

OpenAI Vector Store

Внешнее векторное хранилище OpenAI, к которому агент может обращаться для поиска по документам. ID хранилищ передаются в формате `vs_...` в настройках агента.

RAG (Retrieval-Augmented Generation)

Подход, при котором LLM получает на вход релевантные фрагменты из внешних документов до генерации ответа. Повышает точность и актуальность ответов агента.

Reranker (Переранжирование)

Узел пайплайна поиска, повторно оценивающий найденные чанки и отбирающий top-K наиболее релевантных. Повышает точность результатов RAG-поиска.

Scope (Уровень доступа)

Право, привязанное к API-ключу проекта (например, `workflows.execute`, `executions.approve`). Определяет, какие операции разрешены ключу. Пресеты: «Только чтение», «Выполнение», «Полный доступ».

SIP-транк (SIP Trunk)

Канал телефонной связи через SIP-протокол. Inbound Trunk обрабатывает входящие звонки (с фильтрацией по номерам и IP), Outbound Trunk — исходящие через выбранного провайдера.

SSE (Server-Sent Events)

Протокол однонаправленной потоковой передачи событий от сервера к клиенту. Используется для трансляции результатов выполнения воркфлоу, токенов LLM и вызовов инструментов в реальном времени.

Stagehand (Веб-браузер)

Сервис, предоставляющий агенту инструменты для работы с веб-страницами: открытие URL, клики, заполнение форм, извлечение данных. Использует API-ключ основного LLM-провайдера.

STT (Speech-to-Text)

Распознавание речи — преобразование аудио в текст. В голосовом режиме Pipeline используются провайдеры Deepgram, OpenAI Whisper и Cartesia. Поддерживается автоопределение языка (Auto-detect).

Telegram-бот

Интеграция с Telegram через токен @BotFather. Бот привязывается к проекту, поддерживает режимы Public/Whitelist, контекст диалога, голосовые сообщения и команды-триггеры воркфлоу.

Tool Call (Вызов инструмента)

Запрос LLM на выполнение конкретного инструмента с переданными аргументами. Результат возвращается модели для дальнейшей генерации. Цикл повторяется до 10 раундов или до финального ответа.

TTS (Text-to-Speech)

Синтез речи — преобразование текста в аудио. Поддерживаемые провайдеры: Cartesia, OpenAI, ElevenLabs, Deepgram, Inworld. Настраиваются голос, эмоция, скорость.

VAD (Voice Activity Detection)

Алгоритм определения момента, когда пользователь закончил говорить. Server VAD основан на тишине и порогах громкости; Semantic VAD анализирует смысл сказанного.

Webhook

HTTP-эндпоинт внешней системы, на который платформа отправляет POST-запрос при наступлении события — например, при завершении задачи с настройкой доставки результата через webhook.