ज्ञान आणि RAG
Retrieval-augmented generation (RAG) तुमच्या एजंटला अंदाज लावण्याऐवजी तुमच्या स्वतःच्या दस्तऐवजांमधून उत्तर देऊ देते: जेव्हा एक कॉलर काहीतरी विचारतो, तेव्हा एजंट सर्वात संबंधित उतारे शोधतो आणि त्यांमधून उत्तर देतो. RAG एजंट बिल्डरमध्ये /agent/setup वरील LLM टॅबच्या Add Knowledge Base विभागात कॉन्फिगर केले जाते — कोणताही वेगळा Knowledge टॅब नाही.
इथे RAG कसे काम करते
ज्ञानकोश: दस्तऐवज तुकड्यांमध्ये विभागले जातात, इंडेक्स केले जातात आणि कॉलच्या वेळी मिळवले जातात, सोबत गुणवत्ता आणि कव्हरेज विश्लेषण.
RAG उत्तरे आधारित ठेवते. मॉडेलला आधीच जे माहीत आहे त्यावरच फक्त अवलंबून राहण्याऐवजी, एजंट तुमच्या दस्तऐवजांमधून जुळणारी सामग्री पुनर्प्राप्त करतो आणि प्रतिसाद देण्यासाठी ती वापरतो. याचा अर्थ तुमच्या उत्पादने, धोरणे आणि प्रक्रियांबद्दल अचूक, अद्ययावत उत्तरे — आणि खूप कमी मनगढंत प्रत्युत्तरे.
तुम्ही एक ज्ञान आधार जोडण्यापूर्वी, तुम्हाला एकाची गरज आहे. तुमचे दस्तऐवज (PDF, DOCX किंवा TXT) अपलोड करा आणि त्यांना ज्ञान आधारात व्यवस्थापित करा.
तुम्ही जोडण्यापूर्वी
RAG काहीही करण्यापूर्वी तुम्हाला त्यात सामग्री असलेला एक ज्ञान आधार आवश्यक आहे. क्रम असा आहे:
- ज्ञान आधारात तुमचे दस्तऐवज अपलोड आणि इंडेक्स करा.
- LLM टॅबवर, RAG Enabled चालू करा आणि तो ज्ञान आधार एजंटला जोडा.
- खालील similarity threshold आणि top-k सुधारा.
- खऱ्या प्रश्नांसह चाचणी करा आणि समायोजित करा.
एक ज्ञान आधार जोडा
LLM टॅबवर, RAG Enabled चालू करा आणि या एजंटने ज्यातून घ्यावे असे तुम्हाला वाटते तो ज्ञान आधार (किंवा अनेक) निवडा. एकदा जोडल्यावर, एजंट कॉल दरम्यान आपोआप त्यात शोध घेतो आणि त्याला जे सापडते ते उत्तर देण्यासाठी वापरतो.
Similarity threshold
similarity threshold एक उतारा वापरला जाण्यापूर्वी तो कॉलरच्या प्रश्नाशी किती जवळून जुळला पाहिजे ते सेट करते.
- एक उच्च threshold फक्त मजबूत जुळणी परत करते — अधिक अचूक, परंतु सैलपणे शब्दबद्ध प्रश्नांसाठी एजंटला काहीही सापडणार नाही.
- एक कमी threshold अधिक क्षमाशील आहे आणि अधिक उतारे समोर आणते, कमी संबंधित उतारे खेचण्याच्या जोखमीवर.
ते असे सुधारा की एजंट गोंगाट न आणता विश्वासार्हपणे तुमची सामग्री शोधतो.
Top-k
Top-k एजंट प्रत्येक प्रश्नासाठी सर्वोत्तम-जुळणाऱ्या उताऱ्यांपैकी किती पुनर्प्राप्त करतो ते सेट करते.
- एक लहान top-k उत्तरे घट्ट आणि सर्वात जवळच्या जुळणींवर केंद्रित ठेवते.
- एक मोठा top-k एजंटला काम करण्यासाठी अधिक संदर्भ देतो, जे व्यापक प्रश्नांसाठी मदत करते परंतु उत्तर पातळ करू शकते.
संरक्षणात्मक मूल्यांनी सुरुवात करा, मग /agent/chat वरील chat test मध्ये खऱ्या प्रश्नांसह चाचणी करा. जर एजंट तुमच्या दस्तऐवजांत स्पष्टपणे असलेली उत्तरे चुकवतो, तर threshold कमी करा किंवा top-k थोडा वाढवा; जर तो विषयाबाहेरची सामग्री खेचतो, तर उलट करा.
एका दृष्टीक्षेपात सुधारणा
जेव्हा एजंट तुम्हाला हव्या त्या पद्धतीने उत्तर देत नाही, तेव्हा ही दोन लक्षणे बहुतेक प्रकरणे कव्हर करतात:
| लक्षण | संभाव्य कारण | प्रयत्न करा |
|---|---|---|
| एजंट म्हणतो की त्याला माहीत नाही, परंतु उत्तर तुमच्या दस्तऐवजांत आहे | Threshold खूप कठोर, किंवा top-k खूप लहान | similarity threshold कमी करा, किंवा top-k थोडा वाढवा |
| एजंट विषयाबाहेरची किंवा चुकीची सामग्री खेचतो | Threshold खूप सैल, किंवा top-k खूप मोठा | similarity threshold वाढवा, किंवा top-k कमी करा |
एका वेळी एक सेटिंग बदला आणि पुन्हा चाचणी करा, जेणेकरून प्रत्यक्षात निकाल कशामुळे हलला ते तुम्ही सांगू शकता.