[blog] Технології

RAG і база знань: щоб бот відповідав за вашими даними, а не вигадував

11 червня 2026 р. · MaxICo Labs

Чат-бот, який упевнено називає клієнту неіснуючу знижку або вигадану умову гарантії, — гірший за відсутність бота: за його слова відповідати вам. Це не «глюк конкретного бота», а фундаментальна властивість мовних моделей — і саме її лікує RAG. Розберемо, як працює база знань для чат-бота, що в неї класти, як перевірити, що бот не вигадує відповіді, і скільки коштує зробити це нормально.

RAG що це: пояснення без академізму

RAG (Retrieval-Augmented Generation) — генерація з підкріпленням пошуком. Механіка проста: перш ніж відповісти, система шукає у вашій базі знань фрагменти, релевантні питанню, підкладає їх моделі в контекст і дає інструкцію: відповідай тільки на основі цих фрагментів, якщо відповіді в них немає — чесно скажи, що не знаєш.

Тобто модель перестає бути «всезнайкою з інтернету» і стає інтерфейсом до ваших документів: прайсів, регламентів, описів послуг, договірних умов. Кожна відповідь спирається на конкретний шматок вашого тексту — і його можна показати як джерело.

Чому бот без RAG вигадує

Мовна модель навчена на текстах з інтернету до певної дати. Вона нічого не знає про ваш прайс, графік роботи філії на Подолі чи умови повернення саме у вашому магазині. При цьому модель влаштована так, що завжди генерує найімовірніше продовження тексту — впевнено і граматично бездоганно, навіть коли фактів у неї немає. Це і є галюцинації. Причому що менше модель знає про тему, то впевненіше звучить вигадка — перевірити її без джерела під рукою клієнт не може, а скриншот відповіді з неіснуючою знижкою живе в суперечці з вами вічно.

Практичний наслідок: бот «на чистій моделі» з промптом на кшталт «ти консультант магазину X» приречений вигадувати — питання лише коли. AI на власних даних — єдиний спосіб отримати бота, якому можна довірити розмову з клієнтом про ціни, терміни й умови.

Як влаштована база знань для чат-бота

Під капотом RAG — конвеєр з чотирьох етапів:

Підготовка документів. Прайси, FAQ, регламенти, сторінки сайту конвертуються в чистий текст. Сміття на вході — сміття у відповідях, тому це не формальність: биті таблиці й скани без розпізнавання вбивають якість ще до старту.
Нарізка (chunking). Документи ріжуться на фрагменти по 200–800 токенів — не механічно по довжині, а за змістом: щоб умова і її виняток не роз'їхалися по різних шматках.
Векторизація (embeddings). Кожен фрагмент перетворюється на числовий вектор, який відображає зміст. Близькі за сенсом тексти отримують близькі вектори — саме тому пошук знаходить «скільки коштує доставка», навіть якщо клієнт спитав «а за привезти платити треба?».
Пошук і відповідь. Питання клієнта векторизується, система дістає 3–10 найрелевантніших фрагментів (часто з дореранжуванням для точності), і модель формує відповідь строго на їхній основі — з посиланням на джерело.

До кожного фрагмента чіпляються метадані: тип документа, дата оновлення, продукт, місто. Це дозволяє фільтрувати: на питання про київську філію бот не тягне графік львівської.

Що покласти в базу знань: чеклист

Практичний мінімум для бота служби підтримки чи продажів:

прайс і умови оплати — найчастіша тема і найдорожча для галюцинацій;
FAQ з реальних питань клієнтів — підніміть історію переписок за пів року, там готова структура;
умови доставки, повернення, гарантії — формулювання звіряємо з юристом, бо їх бот цитуватиме дослівно;
описи продуктів і послуг з характеристиками;
регламенти типових ситуацій: не прийшло замовлення, не підійшов розмір, як перенести запис.

Що класти НЕ треба: застарілі версії документів поруч з чинними (бот не знає, яка правильна — конфлікти версій дають найпідступніші помилки), внутрішні документи з даними, які не можна показувати клієнтам, і «все підряд про всяк випадок» — зайвий обсяг погіршує точність пошуку. Хороший орієнтир обсягу для старту — 30–100 сторінок чинних документів: цього достатньо для 80% питань клієнтів, і такий обсяг реально підтримувати в актуальному стані.

Як перевірити, що бот не вигадує: тести і метрики

«Поклікали — наче відповідає нормально» — не приймання. Робочий процес виглядає так:

Golden set. 50–100 реальних питань з еталонними відповідями, включно з каверзними: питання поза базою, питання з подвійним змістом, провокації на знижку, якої немає.
Groundedness. Метрика обґрунтованості: чи кожне твердження відповіді підкріплене фрагментом з бази. Перевіряється автоматично другою моделлю-суддею на всьому golden set після кожної зміни.
«Не знаю» як правильна відповідь. Бот, який на питання поза базою чесно каже «уточню в менеджера» і передає діалог людині, — це успіх, а не недоробка. Найгірший результат — впевнена відповідь з нізвідки.
Цитати джерел. У адмінському режимі кожна відповідь показує, з яких фрагментів зібрана. Це прискорює розбір помилок у рази: одразу видно, проблема в пошуку чи в самому документі.

Цільові показники, з якими ми випускаємо ботів у прод: 95%+ groundedness на golden set і нуль впевнених відповідей на питання, відповіді на які в базі немає. Golden set при цьому живе разом з ботом: кожна знайдена в проді помилка перетворюється на новий тестовий кейс, і наступні зміни вже не можуть зламати те, що одного разу полагодили.

Типові помилки впровадження RAG

Звалити документи в купу і чекати дива. База знань — це продукт зі структурою, власником і циклом оновлення, а не папка з PDF.
Скани без розпізнавання. PDF-скан прайса для системи — картинка. Без OCR цих даних просто не існує.
Базу наповнили і забули. Ціни змінилися — бот відповідає за старими. Потрібен процес: хто і як оновлює базу при кожній зміні прайса чи умов. Технічно оновлення — хвилини, організаційно — це найчастіша точка відмови.
Немає передачі на людину. Навіть ідеальний RAG покриває не все. Шлях «бот → жива людина» з контекстом розмови має бути спроєктований з першого дня.

RAG чи донавчання моделі: що обрати

Часте питання від клієнтів: може, простіше «навчити модель на наших даних»? Для бізнес-ботів відповідь майже завжди — RAG, і ось чому:

Критерій	RAG	Донавчання (fine-tuning)
Оновлення даних	хвилини: замінили документ у базі	новий цикл навчання щоразу
Джерело відповіді	видно, з якого фрагмента взято	невидиме, зашите у ваги моделі
Галюцинації	контролюються інструкцією і перевіркою	нікуди не зникають
Вартість старту	від $1000	у рази дорожче і на старті, і в супроводі

Донавчання має сенс для стилю і формату відповідей, а не для фактів: факти змінюються швидше, ніж ви встигатимете перенавчати модель. Робоча формула для бізнесу: факти — у базі знань, тон і правила поведінки — у промпті.

Скільки коштує бот на власних даних

Чат-бот з RAG під ключ — від $1000–2500 разово: підготовка і нарізка документів, налаштування пошуку, промпти, golden set, інтеграція з сайтом чи месенджером. Операційні витрати — $30–150 на місяць залежно від трафіку. Терміни — 3–5 тижнів з тестуванням, з яких добра третина йде на роботу з вашими документами, і це нормально: якість бази визначає якість бота.

Деталі — на сторінці чат-ботів. Якщо боту треба не лише відповідати, а й діяти — створювати заявки, перевіряти статус замовлення, записувати на візит — це вже AI-агенти: RAG у них лишається шаром знань, поверх якого з'являються дії в ваших системах. Ширшу картину про застосування AI на власних даних компанії ми зібрали на сторінці AI для бізнесу.

Хочете оцінити, чи готові ваші документи для бази знань, і скільки коштуватиме бот під вашу задачу? Запишіться на безкоштовний 30-хвилинний AI-аудит — розберемо ваші джерела даних, накидаємо архітектуру і дамо чесну оцінку бюджету: maxicolabs.com/contact.

Часті питання

Що таке RAG простими словами?

Це підхід, за якого бот перед відповіддю шукає релевантні фрагменти у вашій базі знань і відповідає тільки на їхній основі, а не з «пам'яті» моделі. Якщо відповіді в базі немає — бот чесно каже, що не знає, замість того щоб вигадувати.

Чи може бот з RAG взагалі не помилятися?

Стовідсоткової гарантії не дає жодна система, але правильний RAG знижує галюцинації до одиничних випадків: цільовий рівень — 95%+ відповідей, підкріплених документами, і чесне «не знаю» на питання поза базою з передачею діалогу людині.

Які документи потрібні для бази знань чат-бота?

Мінімум: прайс, FAQ з реальних питань клієнтів, умови доставки й повернення, описи послуг, регламенти типових ситуацій. Формат майже будь-який — сайт, DOCX, PDF, таблиці; головне, щоб версії були чинні, а скани розпізнані.

Скільки коштує чат-бот на власних даних?

Бот з RAG під ключ — від $1000–2500 разово плюс $30–150 на місяць операційних витрат залежно від трафіку. Термін запуску — 3–5 тижнів, з яких значна частина — підготовка і структурування ваших документів.

Читайте також

Технології

n8n vs Make vs Zapier: що обрати у 2026

Практичний гайд по вибору між n8n, Make і Zapier за рівнем навичок, вартістю на масштабі й контролем даних. Коли переходити зі Zapier на n8n.

Технології

RAG Knowledge Bases: AI That Answers From Your Data, Not Guesses

A practitioner's guide to Retrieval-Augmented Generation for European teams. Learn how RAG grounds AI answers in your own documents, why it beats a raw chatbot, and how to build it with GDPR in mind.

AI для бізнесу

AI-агенти для обробки звернень: підключення, інтеграції та контроль витрат для українського бізнесу

Розбираємо, як підключити AI-агента до сайту, CRM чи месенджера, контролювати витрати й уникнути типових помилок при впровадженні для малого та середнього бізнесу.

Автор

MaxICo Labs — ваш партнер по штучному інтелекту

Applied-AI студія Максим Шаповал (засновник MaxICo Labs). Будуємо AI-агентів, чат-боти, голосові агенти, CRM і автоматизацію у проді — і пишемо тут про те, що реально працює. Виросли з MaxICo Agency.

Instagram LinkedIn GitHub Telegram MaxICo Agency

Обговорити ваш AI-проєкт →← Усі статті