Глоссарий
База знаний (Knowledge Base)
Система хранения и поиска документов организации. Индексирует загруженные файлы и обеспечивает семантический поиск, дополняя ответы LLM фактами из документов.
Векторная база (Vector Store)
Хранилище эмбеддингов с поиском по сходству векторов. Платформа использует Qdrant; коллекция изолирована на уровне организации.
Воркфлоу (Workflow)
Визуальный конвейер из нод, реализующий AI-логику без написания кода. Воркфлоу собирается на холсте редактора, выполняется по связям между нодами и поддерживает версионирование.
Выполнение (Execution)
Один запуск воркфлоу. Имеет жизненный цикл: Queued → Running → Completed / Failed / Cancelled / Interrupted. Доступно для просмотра в трассировке.
Голосовой агент (Voice Agent)
AI-ассистент, обрабатывающий речь в режиме реального времени. Принимает аудио на вход, отвечает голосом и работает по каналам Web (WebRTC), SIP или MMD.
Делегирование (Handoff)
Передача управления диалогом от одного агента другому в мульти-агентной архитектуре. Реализована по паттерну Swarm через инструмент `transfer_to_colleague` с передачей контекста.
Задача (Task)
Follow-up действие, создаваемое агентом, пользователем, воркфлоу или через API: напоминание, поручение сотруднику или автозапуск процесса. Поддерживает cron-расписание и доставку результата (в тред, webhook).
Инструмент (Tool)
Возможность, которую агент может вызвать во время разговора: пользовательская функция, MCP-инструмент, воркфлоу, поиск по базе знаний, веб-браузер или операции с памятью.
Источник (Source)
Файл или папка из подключённого хранилища, выбранные для индексации. Источники привязываются к коннектору и пайплайну, могут синхронизироваться по расписанию.
Коннектор (Connector)
Подключение к внешнему хранилищу данных, из которого база знаний загружает документы. Поддерживаемые типы: S3, Google Cloud Storage, Azure Blob Storage, локальное хранилище.
Нода (Node)
Минимальный строительный блок воркфлоу. Каждая нода выполняет одну операцию: вызов агента, HTTP-запрос, ветвление, обращение к базе знаний и т.д. Ноды соединяются связями (edges).
Обработка ошибок
Глобальные настройки воркфлоу для повторных попыток. Ошибки делятся на три категории:
- Повторяемые (retryable) — таймауты, rate limit, сетевые ошибки.
- Исправляемые (correctable) — валидация, парсинг JSON; модель пытается исправить ответ.
- Фатальные (fatal) — ошибки аутентификации и конфигурации; останавливают выполнение.
Организация (Organization)
Верхний уровень иерархии в платформе. Объединяет проекты, пользователей, API-ключи, базу знаний, тарифный план и интеграции. Все ресурсы изолированы между организациями.
Пайплайн (Pipeline)
Цепочка узлов обработки в базе знаний. Бывает двух типов:
- Ingestion — индексация: парсинг, чанкинг, эмбеддинг, сохранение в Vector Store.
- Retrieval — поиск: эмбеддинг запроса, векторный поиск, переранжирование.
Память агента (Memory)
Долгосрочное хранилище фактов, доступное агенту между разговорами. Имеет четыре области:
- thread — в рамках одного диалога.
- user — личная память пользователя во всех его разговорах.
- project — общая память для всех агентов проекта.
- organization — общая память на уровне организации.
Переменная (Variable)
Именованное значение в состоянии воркфлоу. Доступно через синтаксис `{{имя}}`: `{{input}}` (входные данные), `{{lastOutput}}` (результат предыдущей ноды), `{{node_X}}` (результат ноды по ID).
Подтверждение (Approval)
Механизм human-in-the-loop, приостанавливающий воркфлоу до решения человека. Создаётся нодой «Подтверждение»; имеет статусы Pending, Approved, Rejected, Timeout.
Прерывание (Interruption)
Ситуация, когда пользователь начинает говорить во время реплики агента. Параметры `Min Interruption Duration` и `False Interruption Timeout` определяют, реагировать ли агенту на короткие звуки как на прерывание.
Проект (Project)
Рабочее пространство внутри организации, в котором создаются и хранятся воркфлоу, агенты, функции, MCP-серверы и публикации. Имеет собственный API-ключ и часовой пояс.
Публикация (Publication)
Неизменяемый снапшот проекта (воркфлоу, агенты, функции, MCP-серверы), доступный по публичному API. Имеет номер версии; в каждый момент активна только одна публикация.
Публичный API (Published API)
Внешний REST API для запуска опубликованных воркфлоу. Аутентификация через API-ключ проекта в заголовке `Authorization: Bearer`. Поддерживает синхронные вызовы и SSE-стриминг.
Режимы голосового агента
Два подхода к обработке голоса:
- Pipeline — последовательный конвейер STT → LLM → TTS с выбором провайдера для каждого этапа. Максимальная гибкость.
- Realtime — прямая обработка audio-to-audio через API реального времени (OpenAI, Google, xAI). Минимальная задержка.
Роли агента
Определяют поведение агента в мульти-агентной архитектуре:
- Самостоятельный (Standalone) — работает автономно, без делегирования. Роль по умолчанию.
- Оркестратор (Orchestrator) — координирует команду, принимает запросы и передаёт их специалистам.
- Специалист (Specialist) — отвечает за определённую область, получает задачи от оркестратора.
Связь (Edge)
Соединение между выходом одной ноды и входом другой, определяющее порядок выполнения. У ветвящихся нод (If/Else, Guardrails, Подтверждение) несколько именованных выходов.
Сессия (Session)
Один разговор с голосовым агентом. Имеет статус (active/completed/failed/abandoned), длительность, канал связи, транскрипт реплик и метрики производительности.
Системный промпт (System Prompt)
Главная инструкция, определяющая поведение агента: его роль, задачи, ограничения и формат ответа. Поддерживает подстановку переменных вида `{{имя}}` и шаблоны Jinja2.
Снапшот (Snapshot)
Зафиксированное состояние всех компонентов проекта в момент создания публикации. Не изменяется при последующем редактировании проекта; обеспечивает стабильность API.
Состояние (State)
Общее хранилище данных воркфлоу во время выполнения. Содержит входные данные, результат каждой ноды и пользовательские переменные, передаваемые между нодами.
Суб-агент (Sub-agent)
Агент-коллега, подключённый к другому агенту для делегирования задач. Один агент может иметь до 10 коллег, максимальная глубина передач — 5 уровней.
Текстовый агент (Text Agent)
AI-ассистент, общающийся с пользователем в текстовом формате. Использует выбранную LLM, может вызывать инструменты, обращаться к базе знаний, использовать память и делегировать задачи другим агентам.
Температура (Temperature)
Параметр LLM, регулирующий случайность генерации. Низкие значения (0) дают детерминированные ответы, высокие (до 2) — более творческие и непредсказуемые. По умолчанию 0.7.
Тихий режим (Silent Mode)
Опция ноды воркфлоу, при которой её вывод не транслируется в SSE-поток. Полезно для промежуточных нод, результат которых не нужно показывать пользователю.
Трассировка (Tracing)
Раздел для просмотра, фильтрации и анализа выполнений. Показывает таймлайн событий сессии, детали каждого шага, вызовы инструментов и метрики производительности.
Тред (Thread)
Поток выполнения, объединяющий несколько запусков воркфлоу в одну сессию. Идентифицируется через `ThreadId`; в рамках одного треда сохраняется история диалога и контекст агента.
Филлер (Filler / Hesitation)
Короткое аудио-вкрапление («угу», «хмм», «дайте подумать…»), которое голосовой агент воспроизводит во время ожидания LLM или backchannel-реакции. Генерируется автоматически в голосе агента.
Функция (Function)
Пользовательский JavaScript-скрипт, расширяющий возможности агентов и воркфлоу. Имеет имя, описание, JSON Schema параметров и таймаут от 1 до 60 секунд. Подключается как инструмент или используется в ноде «Функция».
Холст (Canvas)
Интерактивная рабочая область визуального редактора, на которой располагаются ноды и связи воркфлоу. Поддерживает перетаскивание, масштабирование, мини-карту и автолэйаут.
Чанк (Chunk)
Фрагмент документа, полученный при разбиении исходного текста. Каждый чанк индексируется отдельно. Ключевые параметры — `chunk_size` (размер) и `chunk_overlap` (перекрытие соседних чанков).
Шаблон промпта (Prompt Template)
Редактируемый блок текста с поддержкой Jinja2-синтаксиса, из которого собирается финальный системный промпт агента. Поддерживает переменные, условия, циклы и историю версий.
Шаг (Step)
Единица выполнения внутри одного запуска воркфлоу — обработка одной ноды. Каждый шаг имеет входные/выходные данные, статус, длительность и порядковый номер.
Эмбеддинг (Embedding)
Числовой вектор фиксированной размерности, представляющий смысл текстового фрагмента. Используется для семантического поиска: близкие по смыслу тексты дают близкие векторы.
API-ключ (API Key)
Секретный токен для аутентификации запросов: либо ключ провайдера LLM/STT/TTS на уровне организации, либо ключ проекта для публичного API. Имеет уровни доступа (scopes) и может быть отозван.
Cron-выражение (Cron Expression)
Строка, описывающая периодическое расписание (например, `0 9 * * 1-5`). Используется для повторяющихся задач и автоматического запуска воркфлоу с учётом часового пояса.
Dispatch Rule (Правило маршрутизации)
Правило, определяющее, какой голосовой агент обрабатывает входящий SIP-звонок. Привязывается к транкам и создаёт LiveKit-комнату для каждого вызова.
Guardrails (Модерация)
Нода, выполняющая LLM-проверку контента по заданным правилам. Возвращает JSON с полями `passed` и `violations`, направляет поток по веткам «Пройдено» или «Не пройдено».
JSON Schema
Формальное описание структуры JSON-объекта, используемое для параметров функций и формата вывода агента. В strict-режиме OpenAI требует `additionalProperties: false`.
LLM (Large Language Model)
Большая языковая модель, генерирующая текст по запросу. Платформа поддерживает модели OpenAI, Anthropic, xAI, Google, Yandex, GigaChat и другие через подключаемых провайдеров.
MCP (Model Context Protocol)
Открытый протокол для стандартизированного подключения AI-моделей к внешним сервисам. Позволяет агенту использовать инструменты внешних систем без написания кода интеграции.
MCP-сервер (MCP Server)
Внешний HTTP-сервис, предоставляющий набор инструментов через протокол Model Context Protocol. Платформа автоматически обнаруживает и подключает инструменты сервера, передавая учётные данные при каждом вызове.
OpenAI Vector Store
Внешнее векторное хранилище OpenAI, к которому агент может обращаться для поиска по документам. ID хранилищ передаются в формате `vs_...` в настройках агента.
RAG (Retrieval-Augmented Generation)
Подход, при котором LLM получает на вход релевантные фрагменты из внешних документов до генерации ответа. Повышает точность и актуальность ответов агента.
Reranker (Переранжирование)
Узел пайплайна поиска, повторно оценивающий найденные чанки и отбирающий top-K наиболее релевантных. Повышает точность результатов RAG-поиска.
Scope (Уровень доступа)
Право, привязанное к API-ключу проекта (например, `workflows.execute`, `executions.approve`). Определяет, какие операции разрешены ключу. Пресеты: «Только чтение», «Выполнение», «Полный доступ».
SIP-транк (SIP Trunk)
Канал телефонной связи через SIP-протокол. Inbound Trunk обрабатывает входящие звонки (с фильтрацией по номерам и IP), Outbound Trunk — исходящие через выбранного провайдера.
SSE (Server-Sent Events)
Протокол однонаправленной потоковой передачи событий от сервера к клиенту. Используется для трансляции результатов выполнения воркфлоу, токенов LLM и вызовов инструментов в реальном времени.
Stagehand (Веб-браузер)
Сервис, предоставляющий агенту инструменты для работы с веб-страницами: открытие URL, клики, заполнение форм, извлечение данных. Использует API-ключ основного LLM-провайдера.
STT (Speech-to-Text)
Распознавание речи — преобразование аудио в текст. В голосовом режиме Pipeline используются провайдеры Deepgram, OpenAI Whisper и Cartesia. Поддерживается автоопределение языка (Auto-detect).
Telegram-бот
Интеграция с Telegram через токен @BotFather. Бот привязывается к проекту, поддерживает режимы Public/Whitelist, контекст диалога, голосовые сообщения и команды-триггеры воркфлоу.
Tool Call (Вызов инструмента)
Запрос LLM на выполнение конкретного инструмента с переданными аргументами. Результат возвращается модели для дальнейшей генерации. Цикл повторяется до 10 раундов или до финального ответа.
TTS (Text-to-Speech)
Синтез речи — преобразование текста в аудио. Поддерживаемые провайдеры: Cartesia, OpenAI, ElevenLabs, Deepgram, Inworld. Настраиваются голос, эмоция, скорость.
VAD (Voice Activity Detection)
Алгоритм определения момента, когда пользователь закончил говорить. Server VAD основан на тишине и порогах громкости; Semantic VAD анализирует смысл сказанного.
Webhook
HTTP-эндпоинт внешней системы, на который платформа отправляет POST-запрос при наступлении события — например, при завершении задачи с настройкой доставки результата через webhook.