Expert modul

RAG és tudásbázis

Amikor az AI nem csak a modell általános tudására támaszkodik, hanem a megfelelő dokumentumokra és forrásokra is.

Egy erős AI-rendszer nem csak attól jó, hogy milyen modellt használ, hanem attól is, milyen tudásréteg áll mögötte. Ha a rendszer nem látja a céged dokumentumait, belső folyamatait, kutatási anyagait vagy aktuális fájljait, könnyen marad általános, pontatlan vagy elavult. A RAG lényege az, hogy az AI a megfelelő forrásokból húzza be a releváns tudást a feladat pillanatában.

A modell önmagában kevés

Nem ismeri automatikusan a te dokumentumaidat, jegyzeteidet és belső folyamataidat.

Grounded output

A válasz konkrét forrásokra támaszkodik, nem csak általános mintákra.

A tudásréteg számít

Az AI minősége részben tudásminőségi kérdés, nem csak modellkérdés.

Rövid átvezetés az agentikus rendszerek modulból

Az előző modulban azt láttad, hogy az erősebb rendszerek terveznek, végrehajtanak, ellenőriznek és javítanak. De van egy kritikus kérdés: miből dolgoznak mindeközben? Minél önállóbb egy rendszer, annál nagyobb a tétje annak, hogy milyen tudásra támaszkodik. A rossz vagy elavult forrás nem csak kisebb hibát okoz, hanem egész folyamatokat visz félre. Ezért a tudásréteg nem kiegészítő extra, hanem alapinfrastruktúra. Innen válik érthetővé, miért következik a RAG közvetlenül az agentikus rendszerek után.

1Tananyagblokk

Kulcspontok

Képesebb rendszer

Minél többet tud csinálni egy rendszer, annál nagyobb gond, ha rossz tudásból dolgozik.

A modell nem mindentudó

Nem ismeri automatikusan a saját céged, projekted vagy dokumentumaid valóságát.

Ezért jön most a tudásréteg

A következő szint az, hogyan kapjon az AI megbízható, releváns és használható forrásokat.

Példák és működő minták

Agent után a tudásréteg

Egy kutatási agent nagyon látványosan tud több körben dolgozni, de ha rossz vagy hiányos forrásokra épül, akkor csak gyorsabban fog hibás briefet készíteni. A valódi különbséget az adja, hogy a rendszer milyen dokumentumokat, policykat vagy adatforrásokat tud megbízhatóan behúzni. A tudásréteg ezért nem kényelmi funkció, hanem minőségi korlát. Agentikus működés jó tudás nélkül könnyen csak gyorsabb tévedés.

Miért nem elég a modell általános tudása?

Még egy erős modell is csak általános mintákból és korábbi tanulásból indul. Ettől lehet ügyes, de nem lesz automatikusan naprakész a te világodban.

2Tananyagblokk

Kulcspontok

Nem ismeri a cégedet

A modell nem tudja magától, hogyan működnek a belső folyamataid, szabályaid vagy dokumentumaid.

Lehet túl általános

Jó hangzású, de kevéssé használható választ adhat, ha nincs konkrét forrása a feladathoz.

Lehet elavult vagy félrecsúszott

Ha nincs megfelelő forráskapcsolat, a rendszer könnyebben támaszkodik régebbi vagy túl általános mintákra.

Példák és működő minták

HR home office példa

Ha egy HR-es azt kérdezi, mik a cégen belüli home office szabályok, egy sima modell csak általános ajánlást ad. Ha viszont a belső HR policy dokumentum be van kötve a rendszerbe, akkor az aktuális, jóváhagyott céges szabályt tudja visszaadni.

Egyszerű példa

Egy modell tudhat általában valamit a support működésről, de nem fogja tudni a te céged ügykezelési szabályait, SLA-ját vagy belső prioritási logikáját, ha ezt nem kapja meg.

Mi az a RAG egyszerűen?

A RAG lényege nem technikai rövidítésként fontos, hanem működési szempontból: az AI nem csak arra támaszkodik, amit 'általában tud', hanem a feladat szempontjából releváns forrásokból is behúz információt, és azt használja munkakontextusként. Emiatt a RAG-ra ma egyre inkább nem egyszerű trükként, hanem tudásrétegként és grounding-rétegként érdemes nézni.

3Tananyagblokk

Kulcspontok

Retrieval

A rendszer megkeresi a releváns anyagokat a kijelölt források között.

Working context

A megtalált információ bekerül a feladat aktuális munkakörnyezetébe.

Nem csak emlékezetből dolgozik

A válasz így közelebb kerül a valós dokumentumokhoz és forrásokhoz.

Nem csak 'feltöltök egy PDF-et'

A lényeg nem az egyszeri feltöltés, hanem az, hogy a rendszer a megfelelő forrásból a megfelelő tudást húzza be a megfelelő pillanatban.

Példák és működő minták

Jogi asszisztens példa

Egy jogi asszisztens feltölt 30 szerződést egy dokumentumalapú AI-be, majd megkérdezi, melyikben van felmondási záradék és mi a határidő. A rendszer nem a saját emlékezetéből válaszol, hanem visszakeres a feltöltött szerződésekben, és onnan húzza be a releváns részeket.

Rövid definíció

A RAG azt jelenti, hogy az AI a megfelelő helyről előveszi a szükséges tudást, és arra támaszkodva válaszol vagy dolgozik tovább.

Ha egyszerűbben szeretnéd

Kérdezd meg az AI-t: „Magyarázd el a RAG-ot úgy, mintha egy nem technikai vezetőnek kellene elmondanom két percben.”

A kontextus itt már tervezési kérdés

A jó AI-viselkedés nem csak a prompton múlik, hanem azon is, milyen kontextust kap a rendszer. A RAG ennek az egyik legfontosabb eszköze: segít a releváns tudást a feladathoz közel vinni.

4Tananyagblokk

Kulcspontok

A jó prompt önmagában nem elég

Ha a rendszer rossz vagy hiányos anyagból dolgozik, a jó prompt sem fog csodát tenni.

A túl sok információ sem jó

Nem az a cél, hogy mindent betoljunk a modell elé, hanem hogy a fontos tudás legyen ott jó időben.

A releváns kontextus érték

A rendszer attól lesz használhatóbb, hogy a megfelelő forrásrészeket kapja meg a megfelelő feladathoz.

Példák és működő minták

500 PDF helyett 3 releváns oldal

Ha egy support AI-nak egyszerre odaadod az összes céges dokumentumot, a releváns 3 oldal mellett 497 irreleváns oldalt is lát. A jó rendszer csak a feladathoz illő néhány oldalt húzza be, és ettől lesz a retrieval és a kontextuskezelés valóban használható.

Egyszerűen

A RAG az egyik fő módja annak, hogy az AI ne csak beszéljen valamiről, hanem valóban a jó háttéranyagra támaszkodjon.

Miért számít a grounding?

A grounding lényege, hogy a válasz ne csak hihető legyen, hanem tényleges forrásokra támaszkodjon. Ez általában relevánsabb és megbízhatóbb outputhoz vezet.

5Tananyagblokk

Kulcspontok

Jobb relevancia

A válasz közelebb kerül a tényleges munkádhoz, nem csak általános sablonokat ismétel.

Kevesebb hallucinációs jellegű hiba

A rendszer kisebb eséllyel talál ki dolgokat, ha konkrét forrásokra támaszkodhat.

A forrásminőség döntő

Ha a dokumentumok rosszak, zavarosak vagy elavultak, a válasz is gyengébb lesz.

A retrieval minősége is döntő

Nem elég hozzáférni a dokumentumokhoz — a rendszernek a jó részeket is meg kell találnia, különben a grounding félrecsúszik.

Példák és működő minták

Elavult eljárásrend példa

Ha a céges eljárásrend dokumentum két éve nem volt frissítve, és az AI erre támaszkodik, a grounded válasz is elavult lesz. A forrás minősége és frissessége emberi felelősség, nem a modell automatikus képessége.

A legfontosabb alapelv

Bad knowledge in → bad output out. A RAG nem csodagép, hanem tudásra épülő rendszer.

Egyszeri keresés vs dinamikus retrieval

Nem minden RAG-rendszer dolgozik ugyanúgy. Van, ahol a rendszer egyszer megkeresi a releváns anyagot, majd abból dolgozik. A fejlettebb megoldások viszont több körben is finomíthatják, mit és hol keressenek.

6Tananyagblokk

Kulcspontok

Statikus retrieval

A rendszer egyszer lekéri a releváns anyagot a forrásból, és arra építi a választ.

Dinamikus retrieval

A rendszer menet közben újra kereshet, pontosíthatja a kérdést, vagy több forrásból rakhat össze jobb kontextust.

Miért számít ez?

Az összetettebb feladatoknál gyakran nem az első megtalált részlet a legjobb alapanyag.

Példák és működő minták

Statikus vs dinamikus retrieval példa

Statikus retrievalnél a rendszer azt keresi meg, milyen az onboarding folyamat, majd visszaadja a releváns onboarding dokumentumrészletet. Dinamikus retrievalnél a tavalyi és idei éves riportot külön előkeresi, majd több körben összeveti őket, mert az első találat még nem elég a jó válaszhoz.

Nem technikai fordításban

Az egyszeri retrieval olyan, mintha egy ember egy gyors keresés után dolgozna tovább. A dinamikus retrieval inkább olyan, mintha menet közben újraellenőrizné, hogy tényleg a jó helyen keresett-e.

Miért ez jön az agentikus rendszerek után?

Minél többre képes egy rendszer, annál veszélyesebb, ha nem jó tudásból dolgozik. A gyorsabb végrehajtás rossz tudással csak gyorsabb hibát jelent.

7Tananyagblokk

Kulcspontok

Erősebb végrehajtás

Az agentikus rendszer már sok mindent meg tud csinálni.

Nagyobb függés a tudástól

De csak annyira lesz hasznos, amennyire a megfelelő forrásokat megkapja.

A tudás minősége rendszerkérdés

Itt a dokumentumminőség, forrásválasztás és grounding már nem mellékszál, hanem alapréteg.

Példák és működő minták

Gyorsabb hiba rossz tudással

Ha egy multi-agent pipeline hibás forrásból dolgozik az első agent szinten, a hiba végigmegy az egész láncon, és az utolsó output is torzítva lesz. Ilyenkor nem az történik, hogy a sok agent kijavítja egymást, hanem az, hogy egymás hibáit erősítik fel. A gyorsabb végrehajtás rossz tudással csak gyorsabb hibát jelent. Ezért kell a tudásréteget az agentikus szint után külön is megérteni.

Gyakorlati példák tudásalapú AI-ra

A RAG nem csak nagyvállalati fogalom. Bárhol értelmet nyer, ahol az AI-nak a te saját anyagaidból kell dolgoznia.

8Tananyagblokk

Kulcspontok

Belső kézikönyv és policy

RAG nélkül a munkatárs kézzel keres a szabályzatban vagy kollégát kérdez. RAG-gal a rendszer a releváns policy-részre válaszol, az emberi review pont pedig ott marad, ahol HR- vagy jogi következménye van a döntésnek.

Meeting note-ok és projektanyagok

RAG nélkül a meetingjegyzetek passzívan állnak a mappákban, és kézzel kell belőlük visszakeresni a döntéseket. RAG-gal a rendszer több megbeszélésből hoz be releváns részeket, a human review pedig a végső összefoglaló vagy státuszriport ellenőrzése.

Support tudásbázis

RAG nélkül a supportos fejből vagy több rendszer között ugrálva válaszol. RAG-gal a FAQ, policy és korábbi megoldások együtt adják a választ, a human review pont pedig az ügyfélnek küldött végleges válasz.

Kutatási könyvtár

RAG nélkül az elemző kézzel gyűjti össze a cikkeket és saját jegyzetből rak össze briefinget. RAG-gal a rendszer a releváns tanulmányokból épít első összefoglalót, a human review pedig a következtetések és ajánlások validálása.

Jogi vagy compliance anyag

RAG nélkül a jogi asszisztens kézzel keres elő korábbi irányelveket és záradékokat. RAG-gal a rendszer a jóváhagyott dokumentumokra támaszkodik, a human review pont pedig a végső jogi értelmezés és kiküldhető anyag ellenőrzése.

Személyes jegyzet- vagy tanulási tár

RAG nélkül a saját PDF-ek és jegyzetek csak archívumként működnek. RAG-gal ténylegesen kérdezhető tudásréteggé válnak, a human review pedig ott kell, amikor a válaszból döntés, publikálható anyag vagy vizsgaanyag lesz.

Példák és működő minták

Mit változtat ez meg?

Az AI ilyenkor nem csak 'okosabbnak tűnik', hanem ténylegesen közelebb kerül ahhoz a tudáshoz, amiből neked dolgoznia kell.

A modern tudásréteg már nem csak sima szöveg

A 2025–2026-os gyakorlatban a tudásréteg egyre kevésbé csak tiszta, lineáris szöveg. PDF-ek, táblázatok, diagramok, screenshotok és vegyes formátumú dokumentumok is fontosak lehetnek.

9Tananyagblokk

Kulcspontok

Multimodális források

Nem csak jegyzetek és cikkek számítanak, hanem táblázatok, képernyőképek, riportok és összetett dokumentumok is.

Enterprise minta

A RAG ma már nem csak demó vagy prototípus: sok szervezet valódi működési rétegként használ tudásalapú AI-t.

Az igazi kihívás

A kérdés nem az, hogy 'be tudom-e tölteni a fájlt', hanem az, hogy megbízható, releváns és operatívan használható tudást kap-e a rendszer.

Példák és működő minták

Pénzügyi elemző csapat példája

Egy pénzügyi elemző csapatnál a negyedéves riportok PDF-ben, a számok xlsx-ben, a vezetői slide deckek pptx-ben élnek. A modern RAG-rendszer ezekből a vegyes formátumokból is tud keresni és kontextust építeni, nem csak tiszta szövegfájlokból.

Mit jelent ez a gyakorlatban?

Egy komolyabb szervezeti rendszernek gyakran többféle dokumentumtípusból kell összeraknia a jó kontextust, nem csak egyetlen szépen formázott szövegfájlból.

Ezzel jól kipróbálható

A RAG-logikát a legjobb úgy megérteni, ha kipróbálod valamelyik dokumentumalapú AI-környezetben. A különböző szintek különböző mélységű tapasztalatot adnak: van no-code belépő, van napi munkára használható enterprise megoldás, és van fejlesztői framework-szint. Érdemes az egyszerűbbel kezdeni, mert ott gyorsan látszik, mit jelent a forrásra támaszkodó válasz. A haladóbb eszközök azt mutatják meg, hogyan lesz ebből saját rendszer vagy szervezeti tudásréteg. A lényeg mindenhol ugyanaz: az AI ne általános emlékezetből, hanem kijelölt tudásból dolgozzon.

10Tananyagblokk

Kulcspontok

NotebookLM (Google)

A legjobb no-code belépő a RAG-logika megértéséhez. Feltöltesz dokumentumokat, weblapokat vagy Google Docokat, és az AI ezekből dolgozik ahelyett, hogy általános tudásból válaszolna. Nagyon gyorsan látszik rajta, mennyit számít a kijelölt forrás. Oktatásra és első kipróbálásra ezért különösen jó.

Claude Projects

Dokumentumokat tölthetsz fel, és az AI az adott projektben ezekre támaszkodik. Belső policy, kutatási anyag, meeting-összefoglaló vagy ügyfélanyag mind beágyazható ebbe a munkakörnyezetbe. Jól megmutatja, hogyan lesz a feltöltött anyag valódi munkakontextus, nem csak melléklet. Akkor erős, ha napi használatban akarod látni a dokumentumalapú AI-t.

Microsoft 365 Copilot

Ez az enterprise szintű RAG-integráció egyik legerősebb mintája: email, dokumentum, meeting és SharePoint-tartalom együtt adja a tudásréteget. A rendszer nem egyetlen PDF-ből dolgozik, hanem a munkahelyi ökoszisztéma több forrásából. Ettől látszik, hogy a RAG nem csak prototípus-trükk, hanem szervezeti működési minta is lehet. Nagyvállalati környezetben ez a logika a mindennapi AI-használat alapja.

Cursor (kódbázis-RAG)

A kódolói világban a RAG azt jelenti, hogy az AI nem általánosan tud programozni, hanem a te konkrét kódbázisodat ismeri. Cursor indexeli a projektedet, és a kérdéseidre ebből a konkrét kontextusból válaszol. Így lesz a válasz releváns a saját architektúrádra, nem csak általánosan helyes. Ez nagyon jó példa arra, hogy a RAG nem csak dokumentumokra, hanem kódbázisra is értelmezhető.

LlamaIndex / LangChain

Ha saját RAG-rendszert akarsz építeni fejlesztőként, ezek a legismertebb keretrendszerek a dokumentumbetöltéstől az indexelésen át a retrievalig. Nem no-code eszközök, viszont nagyon jól látszik bennük a mögöttes logika: loader, splitter, embedder, retriever, generator. Akkor hasznosak, ha az architektúrát is érteni akarod, nem csak használni a kész felületet. Fogalmi szempontból is fontos referenciák.

Perplexity

Nem klasszikus RAG a saját dokumentumaidból, de jól demonstrálja a grounding elvét: a válasz mögött citált források állnak, nem puszta general knowledge. Ettől jó kontrasztot ad a forrás nélkül válaszoló modellekhez képest. A saját dokumentumos RAG és a webes grounding közti hasonlóság itt válik világossá. Tanulásra ezért kifejezetten hasznos.

Példák és működő minták

Melyiket mikor?

RAG-logika megértéséhez a NotebookLM a legegyszerűbb. Napi munkában a Claude Projects vagy a Microsoft 365 Copilot mutatja meg, hogyan lesz ebből valódi munkahelyi tudásréteg. Saját dokumentumalapú rendszer építéséhez a LlamaIndex vagy a LangChain a jó választás. Kódbázis-RAG-hoz pedig a Cursor ad nagyon tiszta mintát.

Mit kérdezz meg az AI-tól?

„Szimulálj két választ ugyanarra a kérdésre: egyet általános modellként, egyet úgy, mintha hozzáférnél ehhez a konkrét dokumentumhoz.” Adj mellé egy policy-részletet vagy szerződésrészletet, és azonnal látszik a grounded működés különbsége. Ez jó tanulási gyakorlat akkor is, ha még nincs saját RAG-rendszered. Segít megérteni, miért nem elég a sima modell.

Connector vs RAG vs agent vs MCP vs tudásbázis

Ezeket könnyű összekeverni, pedig mind más réteget jelentenek.

11Tananyagblokk

Kulcspontok

Connector

Kapcsolat egy rendszerhez vagy forráshoz.

MCP

A strukturált kapcsolódás szabványosabb rétege.

Knowledge base

A gondosan kiválasztott és kezelt dokumentum- vagy adattest, amelyből dolgozni akarsz.

RAG

Az a működési logika, amely a releváns tudást ebből a forrásvilágból behúzza az aktuális feladathoz.

Agent

Az a végrehajtó vagy döntéstámogató réteg, amely ezt a tudást felhasználva dolgozik tovább.

Példák és működő minták

Fine-tuning vs RAG

A fine-tuningnál a modellbe próbálod beégetni a mintákat vagy tudást, ami lassúbb, drágább és nehezebben frissíthető. A RAG ezzel szemben futásidőben húzza be a releváns forrást a konkrét feladathoz, ezért gyorsabban frissíthető és rugalmasabb. A legtöbb szervezeti use case-re ezért a RAG jobb első választás. Nem a modellt tanítod újra, hanem a jó tudást viszed oda, ahol kell.

Mi NEM a RAG?

A RAG-ról is könnyű túl nagy vagy rossz elvárásokat kialakítani.

12Tananyagblokk

Kulcspontok

Nem igazsággép

A forrásokra támaszkodás javít a válaszokon, de nem helyettesíti az emberi ítélőképességet.

Nem csak keresés

A sima search önmagában még nem ugyanaz, mint a feladathoz illesztett tudásbehozás.

Nem csak nagyvállalatoknak való

Kisebb csapatoknál, egyéni tudásmunkánál vagy saját jegyzeteknél is hasznos lehet.

Nem csak fejlesztőknek

Nem kell adatbázist építened ahhoz, hogy megértsd a logikáját és értelmesen használj ilyen rendszereket.

Nem fine-tuning

A modell átállítása és a releváns dokumentumokból történő tudásbehozás nem ugyanaz a dolog.

Nem prototípus-trükk

A modern RAG ma már komoly szervezeti mintázat is lehet, ha jó forrásokra, jó retrievalre és jó review-ra épül.

Példák és működő minták

A RAG nem old meg mindent

Sokan azt várják, hogy ha be van kötve egy tudásbázis, akkor megszűnik a hallucináció. Ez nem igaz: a RAG csökkenti a bizonytalanságot, de ha rossz forrást hoz be a retrieval, a válasz ugyanúgy rossz lesz. A grounded válasz is lehet elavult vagy félrevezető. A RAG ezért nem varázslat, hanem minőségjavító réteg.

Az ember szerepe: forrásválasztás és gondozás

A legerősebb tudásalapú rendszer is csak annyira jó, amennyire jók és rendezettek a forrásai.

13Tananyagblokk

Kulcspontok

Te döntöd el, mi számít megbízható forrásnak

Nem minden dokumentum egyforma értékű vagy naprakész.

Te építed a tudásbázist

Mit teszel bele, mit hagysz ki, mit tartasz frissen — ez emberi döntés.

Te ellenőrzöd a kritikus outputot

A fontos jogi, pénzügyi, üzleti vagy szervezeti döntéseknél továbbra is kell review.

Példák és működő minták

Onboarding bot hibaeset

Egy onboarding bot fél évig jól működött, aztán elkezdett rossz válaszokat adni. Kiderült, hogy az onboarding dokumentumot közben frissítették, de a tudásbázisban a régi verzió maradt bent, így a rendszer már elavult forrásból dolgozott.

Hasznos tanulási tipp

Ha nem tudod, egy dokumentumhalmaz elég-e egy feladathoz, kérdezd meg az AI-t: „Milyen hiányzó források vagy dokumentumtípusok kellenének még ehhez a tudásbázishoz?”

Mit vigyél magaddal ebből a modulból?

Az AI minősége nem csak modellkérdés. Sokszor legalább ennyire tudáskérdés is. A jobb modell nem helyettesíti a jobb forrásréteget. Ha a tudásréteg gyenge, a fejlettebb rendszer is bizonytalan marad. Ha a tudásréteg jó, a válaszok sokkal használhatóbbá válnak. Ezt a különbséget kell ebből a modulból magaddal vinni.

14Tananyagblokk

Kulcspontok

A modell önmagában nem elég

A saját világodhoz a saját dokumentumaid és megbízható forrásaid kellenek.

A grounding növeli a használhatóságot

A forrásokra támaszkodó rendszer általában relevánsabb és kevésbé bizonytalan.

A retrieval minősége számít

Nem elég, hogy a rendszer hozzáfér a tudáshoz — azt is jól kell kiválasztania.

A tudásréteg stratégiai réteg

Ha jó a tudásbázis és jó a grounding, az AI-rendszer is sokkal hasznosabb alapra épül.

Példák és működő minták

A tudásréteg karbantartás

Egy jó RAG-rendszer is el tud romlani, ha a mögötte lévő dokumentumok elavulnak, ellentmondásossá válnak vagy kezelhetetlen méretűre nőnek. A tudásréteg ezért nem egyszeri implementáció, hanem folyamatos karbantartási feladat. Aki ezt elhanyagolja, az előbb-utóbb rossz grounded válaszokat fog kapni. A technológia itt nem váltja ki a forrásgondozást.

Próbáld ki tanulás közben

Kérd meg az AI-t, hogy szimuláljon két választ ugyanarra a kérdésre: egy sima modellválaszt és egy forrásokra támaszkodó, grounded verziót. Adj mellé valós policy- vagy meeting-részletet, és nézd meg, hogyan változik a pontosság és a használhatóság. Ez gyorsan megmutatja, miért stratégiai kérdés a tudásréteg. És azt is, hogy a jobb tudás sokszor többet számít, mint az újabb modell.

Következő lépés

Most már látszik, hogy a jobb AI-rendszerhez nem elég a jó modell és a jó folyamat: kell egy megbízható tudásréteg is. A következő és egyben záró expert modul azt mutatja meg, hogyan lesz mindebből szervezeti szinten kezelhető rendszer: szabályokkal, hozzáféréssel, kontrollal, review-val és felelősséggel.

Tovább a Governance modulra Vissza a modulok áttekintéséhez

Előző lecke

←

Agentikus rendszerek

Következő lecke

Governance

→