ज्ञान और RAG

पुनर्प्राप्ति-संवर्धित निर्माण (RAG) आपके एजेंट को अनुमान लगाने के बजाय आपके अपने दस्तावेज़ों से उत्तर देने देता है: जब कोई कॉल करने वाला कुछ पूछता है, तो एजेंट सबसे प्रासंगिक अंशों को देखता है और उनसे उत्तर देता है। RAG को /agent/setup पर एजेंट बिल्डर में LLM टैब के Add Knowledge Base अनुभाग में कॉन्फ़िगर किया जाता है — कोई अलग Knowledge टैब नहीं है।

RAG यहाँ कैसे काम करता है

RAG के साथ एक ज्ञान आधार एक नॉलेज बेस: दस्तावेज़ों को chunk में बाँटा, इंडेक्स किया और कॉल के समय रिट्रीव किया जाता है, साथ में गुणवत्ता और कवरेज विश्लेषण।

RAG उत्तरों को आधारित रखता है। केवल मॉडल को पहले से जो पता है उस पर निर्भर रहने के बजाय, एजेंट आपके दस्तावेज़ों से मेल खाती सामग्री पुनर्प्राप्त करता है और प्रतिक्रिया देने के लिए इसका उपयोग करता है। इसका अर्थ है आपके उत्पादों, नीतियों और प्रक्रियाओं के बारे में सटीक, अद्यतन उत्तर — और कहीं कम मनगढ़ंत उत्तर।

किसी ज्ञान आधार को लिंक करने से पहले, आपको एक चाहिए। अपने दस्तावेज़ (PDF, DOCX या TXT) अपलोड करें और उन्हें ज्ञान आधार में प्रबंधित करें।

लिंक करने से पहले

RAG कुछ करने से पहले आपको इसमें सामग्री वाले एक ज्ञान आधार की ज़रूरत है। क्रम यह है:

ज्ञान आधार में अपने दस्तावेज़ अपलोड और अनुक्रमित करें।
LLM टैब पर, RAG Enabled चालू करें और उस ज्ञान आधार को एजेंट से लिंक करें।
नीचे समानता सीमा और top-k ट्यून करें।
वास्तविक प्रश्नों के साथ परीक्षण करें और समायोजित करें।

एक ज्ञान आधार लिंक करें

LLM टैब पर, RAG Enabled चालू करें और वह ज्ञान आधार (या कई) चुनें जिससे आप चाहते हैं कि यह एजेंट लें। लिंक होने पर, एजेंट कॉल के दौरान इसे स्वतः खोजता है और जो मिलता है उससे उत्तर देता है।

समानता सीमा

समानता सीमा यह सेट करती है कि उपयोग होने से पहले किसी अंश को कॉल करने वाले के प्रश्न से कितना करीबी मेल खाना चाहिए।

एक उच्च सीमा केवल मज़बूत मेल लौटाती है — अधिक सटीक, पर एजेंट को ढीले शब्दांकन वाले प्रश्नों के लिए कुछ नहीं मिल सकता।
एक निम्न सीमा अधिक उदार है और अधिक अंश सामने लाती है, कम प्रासंगिक अंश खींचने के जोखिम पर।

इसे इस तरह ट्यून करें कि एजेंट शोर खींचे बिना आपकी सामग्री विश्वसनीय रूप से ढूँढ ले।

Top-k

Top-k यह सेट करता है कि एजेंट प्रत्येक प्रश्न के लिए सबसे अच्छे-मेल वाले कितने अंश पुनर्प्राप्त करता है।

एक छोटा top-k उत्तरों को कसा हुआ और निकटतम मेल पर केंद्रित रखता है।
एक बड़ा top-k एजेंट को काम करने के लिए अधिक संदर्भ देता है, जो व्यापक प्रश्नों के लिए मदद करता है पर उत्तर को पतला कर सकता है।

tip

रूढ़िवादी मानों से शुरू करें, फिर /agent/chat पर चैट परीक्षण में वास्तविक प्रश्नों के साथ परीक्षण करें। यदि एजेंट ऐसे उत्तर चूकता है जो स्पष्ट रूप से आपके दस्तावेज़ों में हैं, तो सीमा कम करें या top-k थोड़ा बढ़ाएँ; यदि यह असंबंधित सामग्री खींचता है, तो उल्टा करें।

एक नज़र में ट्यूनिंग

जब एजेंट आपकी इच्छा के अनुसार उत्तर नहीं दे रहा हो, तो ये दो लक्षण अधिकांश मामलों को कवर करते हैं:

लक्षण	संभावित कारण	आज़माएँ
एजेंट कहता है कि उसे नहीं पता, पर उत्तर आपके दस्तावेज़ों में है	सीमा बहुत सख्त, या top-k बहुत छोटा	समानता सीमा कम करें, या top-k थोड़ा बढ़ाएँ
एजेंट असंबंधित या गलत सामग्री खींचता है	सीमा बहुत ढीली, या top-k बहुत बड़ा	समानता सीमा बढ़ाएँ, या top-k कम करें

एक समय में एक सेटिंग बदलें और फिर से परीक्षण करें, ताकि आप बता सकें कि वास्तव में किसने परिणाम बदला।

RAG यहाँ कैसे काम करता है​

लिंक करने से पहले​

एक ज्ञान आधार लिंक करें​

समानता सीमा​

Top-k​

एक नज़र में ट्यूनिंग​

अगले कदम​