Перейти к основному содержимому

База знаний (RAG)

Нода База знаний выполняет семантический поиск по загруженным документам организации и возвращает наиболее релевантные фрагменты текста. Это реализация подхода RAG (Retrieval-Augmented Generation), который позволяет обогащать контекст AI-модели актуальной информацией из ваших документов.

Назначение

  • Поиск релевантной информации в корпоративных документах
  • Обогащение контекста агента перед генерацией ответа
  • Построение вопросно-ответных систем на основе документации
  • Проверка фактов по базе знаний

Настройки

Поисковый запрос (searchQuery)

Текст запроса для семантического поиска. Поддерживает подстановку переменных:

  • {{input}} -- использовать входные данные как запрос
  • {{lastOutput}} -- использовать результат предыдущей ноды
  • {{input.question}} -- конкретное поле из входных данных

Если запрос не указан, нода использует входные данные от предыдущей ноды.

Максимум результатов (maxResults)

Количество возвращаемых фрагментов. По умолчанию: 5.

Чем больше результатов, тем полнее контекст, но тем больше токенов потребуется для обработки агентом.

Порог релевантности (scoreThreshold)

Минимальный балл схожести для включения фрагмента в результат. Диапазон: 0.0 -- 1.0. По умолчанию: 0.7.

  • 0.9 -- только высокорелевантные результаты
  • 0.7 -- баланс между полнотой и точностью (рекомендуется)
  • 0.5 -- более широкий поиск, включая частично релевантные результаты

Входные данные

Текст запроса от предыдущей ноды (если searchQuery не задан явно).

Выходные данные

{
"success": true,
"query": "текст запроса",
"results": [
{
"text": "текст найденного фрагмента",
"score": 0.89,
"source_id": "doc_abc123",
"metadata": {
"filename": "manual.pdf",
"page": 12
}
}
],
"count": 3
}

При ошибке:

{
"success": false,
"error": "описание ошибки",
"results": []
}

Подключения

  • Вход: один вход (слева)
  • Выход: один выход output (справа)

Типичный паттерн использования

RAG + Агент

Наиболее распространенный сценарий: сначала поиск по базе знаний, затем передача результатов агенту.

  1. Старт -- пользователь задает вопрос
  2. База знаний -- поиск по документам
  3. Сообщение -- формирование промпта с контекстом:
    Ответь на вопрос пользователя, используя следующий контекст:

    Контекст:
    {{lastOutput.results}}

    Вопрос: {{input}}
  4. Агент или LLM -- генерация ответа

Мультиисточниковый RAG

Несколько нод База знаний с разными запросами, результаты объединяются функцией:

  1. База знаний (1) -- поиск по техдокументации
  2. База знаний (2) -- поиск по FAQ
  3. Функция -- объединение результатов
  4. Агент -- генерация ответа

Примеры использования

Ответы на вопросы по документации

searchQuery: {{input}}
maxResults: 5
scoreThreshold: 0.7

Проверка фактов

searchQuery: {{node_2.claim}}
maxResults: 3
scoreThreshold: 0.8
Предварительная загрузка документов

Перед использованием ноды База знаний необходимо загрузить документы через раздел «База знаний» в настройках проекта. Поддерживаемые форматы: PDF, DOCX, TXT, MD и другие текстовые форматы.

Область поиска

Поиск выполняется по всем документам текущей организации. Для ограничения области поиска используйте метаданные документов или создавайте отдельные коллекции.