அறிவு & RAG
LLM (Model) தாவலின் Add Knowledge Base பிரிவு (தனி Knowledge தாவல் இல்லை), உங்கள் முகவர் ஊகிப்பதற்குப் பதிலாக உங்கள் சொந்த ஆவணங்களிலிருந்து பதிலளிக்க அனுமதிக்கிறது. இது முகவரை ஒரு அறிவுத் தளத்துடன் இணைத்து, retrieval-augmented generation (RAG) ஐப் பயன்படுத்துகிறது: ஒரு அழைப்பாளர் எதையாவது கேட்கும்போது, முகவர் மிகவும் தொடர்புடைய பத்திகளைத் தேடி அவற்றிலிருந்து பதிலளிக்கிறது. இதை முகவர் உருவாக்கியில் /agent/setup என்ற இடத்தில் அமைக்கவும்.
RAG இங்கு எவ்வாறு வேலை செய்கிறது
அறிவுத் தளம்: ஆவணங்கள் துண்டுகளாக்கப்பட்டு, அட்டவணைப்படுத்தப்பட்டு, அழைப்பு நேரத்தில் மீட்டெடுக்கப்படுகின்றன, தரம் மற்றும் கவரேஜ் பகுப்பாய்வுடன்.
RAG பதில்களை அடித்தளமிட்டே வைத்திருக்கிறது. மாதிரிக்கு ஏற்கனவே தெரிந்ததை மட்டுமே நம்புவதற்குப் பதிலாக, முகவர் உங்கள் ஆவணங்களிலிருந்து பொருந்தும் உள்ளடக்கத்தை மீட்டெடுத்து அதைப் பயன்படுத்திப் பதிலளிக்கிறது. இதன் பொருள் உங்கள் தயாரிப்புகள், கொள்கைகள் மற்றும் செயல்முறைகள் பற்றிய துல்லியமான, புதுப்பித்த பதில்கள் — மேலும் மிகக் குறைவான கட்டுக்கதையான பதில்கள்.
ஒரு அறிவுத் தளத்தை இணைப்பதற்கு முன், உங்களுக்கு ஒன்று தேவை. உங்கள் ஆவணங்களை (PDF, DOCX அல்லது TXT) அறிவுத் தளத்தில் பதிவேற்றி நிர்வகிக்கவும்.
நீங்கள் இணைப்பதற்கு முன்
இந்தத் தாவல் எதையும் செய்வதற்கு முன், உள்ளடக்கம் கொண்ட ஒரு அறிவுத் தளம் உங்களுக்குத் தேவை. வரிசை இதுதான்:
- உங்கள் ஆவணங்களை அறிவுத் தளத்தில் பதிவேற்றி அட்டவணைப்படுத்துங்கள்.
- இந்தத் தாவலுக்குத் திரும்பி வந்து அந்த அறிவுத் தளத்தை முகவருடன் இணைக்கவும்.
- கீழே உள்ள ஒற்றுமை வாசல் மற்றும் top-k ஐ சரிசெய்யுங்கள்.
- உண்மையான கேள்விகளுடன் சோதித்து சரிசெய்யுங்கள்.
ஒரு அறிவுத் தளத்தை இணைக்கவும்
Knowledge தாவலில், இந்த முகவர் எதிலிருந்து பெற வேண்டுமோ அந்த அறிவுத் தளத்தை இணைக்கவும். ஒருமுறை இணைக்கப்பட்டவுடன், முகவர் அழைப்புகளின் போது அதைத் தானாகவே தேடி, அதில் கண்டறிந்ததைப் பயன்படுத்திப் பதிலளிக்கிறது.
ஒற்றுமை வாசல்
ஒற்றுமை வாசல் (similarity threshold), ஒரு பத்தி பயன்படுத்தப்படுவதற்கு முன், அழைப்பாளரின் கேள்வியுடன் அது எவ்வளவு நெருக்கமாகப் பொருந்த வேண்டும் என்பதை அமைக்கிறது.
- உயர்ந்த வாசல் வலுவான பொருத்தங்களை மட்டுமே வழங்குகிறது — மிகவும் துல்லியமானது, ஆனால் தளர்வாக வார்த்தைகள் அமைந்த கேள்விகளுக்கு முகவர் எதையும் கண்டறியாமல் போகலாம்.
- குறைந்த வாசல் அதிக மன்னிக்கும் தன்மை கொண்டது, மேலும் அதிக பத்திகளை வெளிக்கொணர்கிறது, ஆனால் குறைவான தொடர்புடையவற்றை இழுத்து வரும் அபாயம் உள்ளது.
இரைச்சலை இழுத்து வராமல் முகவர் உங்கள் உள்ளடக்கத்தை நம்பகமாகக் கண்டறியும் வகையில் இதைச் சரிசெய்யுங்கள்.
Top-k
ஒவ்வொரு கேள்விக்கும் சிறந்த முறையில் பொருந்தும் பத்திகளில் எத்தனையை முகவர் மீட்டெடுக்கிறது என்பதை Top-k அமைக்கிறது.
- சிறிய top-k பதில்களை இறுக்கமாகவும், நெருங்கிய பொருத்தங்களில் கவனம் குவித்தும் வைத்திருக்கிறது.
- பெரிய top-k முகவருக்கு வேலை செய்ய அதிக சூழலை வழங்குகிறது, இது விரிவான கேள்விகளுக்கு உதவுகிறது ஆனால் பதிலை நீர்த்துப்போகச் செய்யலாம்.
பழமைவாத மதிப்புகளுடன் தொடங்கி, பின்னர் /agent/chat என்ற இடத்தில் உள்ள chat test-இல் உண்மையான கேள்விகளுடன் சோதியுங்கள். உங்கள் ஆவணங்களில் தெளிவாக உள்ள பதில்களை முகவர் தவறவிட்டால், ஒற்றுமை வாசலைக் குறைக்கவும், அல்லது top-k ஐ சிறிது உயர்த்தவும்; அது தலைப்பற்ற உள்ளடக்கத்தை இழுத்து வந்தால், அதற்கு நேர்மாறாகச் செய்யுங்கள்.
ஒரு பார்வையில் சரிசெய்தல்
முகவர் நீங்கள் விரும்பும் வகையில் பதிலளிக்காதபோது, இந்த இரண்டு அறிகுறிகள் பெரும்பாலான வழக்குகளை உள்ளடக்குகின்றன:
| அறிகுறி | வாய்ப்புள்ள காரணம் | முயற்சிக்கவும் |
|---|---|---|
| பதில் உங்கள் ஆவணங்களில் இருந்தாலும், தனக்குத் தெரியாது என்று முகவர் கூறுகிறது | வாசல் மிகவும் கடுமையானது, அல்லது top-k மிகச் சிறியது | ஒற்றுமை வாசலைக் குறைக்கவும், அல்லது top-k ஐ சிறிது உயர்த்தவும் |
| முகவர் தலைப்பற்ற அல்லது தவறான உள்ளடக்கத்தை இழுத்து வருகிறது | வாசல் மிகவும் தளர்வானது, அல்லது top-k மிகப் பெரியது | ஒற்றுமை வாசலை உயர்த்தவும், அல்லது top-k ஐ குறைக்கவும் |
ஒரு நேரத்தில் ஒரு அமைப்பை மட்டும் மாற்றி மீண்டும் சோதியுங்கள், இதனால் உண்மையில் முடிவை எது மாற்றியது என்பதை நீங்கள் அறிய முடியும்.