نالج اور RAG

Retrieval-augmented generation (RAG) آپ کے ایجنٹ کو اندازہ لگانے کے بجائے آپ کے اپنے دستاویزات سے جواب دینے دیتا ہے: جب کوئی کالر کچھ پوچھتا ہے، ایجنٹ سب سے زیادہ متعلقہ اقتباسات تلاش کرتا ہے اور انہی سے جواب دیتا ہے۔ RAG ایجنٹ بلڈر میں /agent/setup پر LLM ٹیب کے Add Knowledge Base سیکشن میں ترتیب دیا جاتا ہے — کوئی الگ Knowledge ٹیب نہیں ہے۔

یہاں RAG کیسے کام کرتا ہے

RAG کے ساتھ نالج بیس نالج بیس: دستاویزات کو ٹکڑوں میں تقسیم، انڈیکس اور کال کے وقت بازیافت کیا جاتا ہے، معیار اور احاطے کے تجزیے کے ساتھ۔

RAG جوابات کو مستند رکھتا ہے۔ صرف اسی پر انحصار کرنے کے بجائے جو ماڈل پہلے سے جانتا ہے، ایجنٹ آپ کے دستاویزات سے مماثل مواد حاصل کرتا ہے اور جواب دینے کے لیے اسے استعمال کرتا ہے۔ اس کا مطلب ہے آپ کی مصنوعات، پالیسیوں اور عمل کے بارے میں درست، تازہ ترین جوابات — اور کہیں کم گھڑے ہوئے جواب۔

اس سے پہلے کہ آپ کوئی knowledge base لنک کر سکیں، آپ کو ایک knowledge base کی ضرورت ہے۔ اپنے دستاویزات (PDF، DOCX یا TXT) اپ لوڈ کریں اور انہیں Knowledge base میں منظم کریں۔

لنک کرنے سے پہلے

RAG کسی بھی کام سے پہلے آپ کو ایک ایسے knowledge base کی ضرورت ہے جس میں مواد موجود ہو۔ ترتیب یہ ہے:

اپنے دستاویزات Knowledge base میں اپ لوڈ اور index کریں۔
LLM ٹیب پر، RAG Enabled آن کریں اور اُس knowledge base کو ایجنٹ سے لنک کریں۔
نیچے دی گئی similarity threshold اور top-k ٹیون کریں۔
حقیقی سوالات کے ساتھ آزمائیں اور ایڈجسٹ کریں۔

ایک knowledge base لنک کریں

LLM ٹیب پر، RAG Enabled آن کریں اور وہ knowledge base (یا کئی) منتخب کریں جس سے آپ چاہتے ہیں کہ یہ ایجنٹ مواد لے۔ ایک بار لنک ہو جانے کے بعد، ایجنٹ کالز کے دوران اسے خودکار طور پر تلاش کرتا ہے اور جواب دینے کے لیے جو پاتا ہے اسے استعمال کرتا ہے۔

Similarity threshold

similarity threshold طے کرتا ہے کہ کسی اقتباس کو استعمال کرنے سے پہلے اسے کالر کے سوال سے کتنا قریبی مماثل ہونا چاہیے۔

ایک زیادہ threshold صرف مضبوط مماثلتیں واپس کرتا ہے — زیادہ درست، لیکن ایجنٹ کو ڈھیلے الفاظ والے سوالات کے لیے شاید کچھ نہ ملے۔
ایک کم threshold زیادہ نرم ہے اور زیادہ اقتباسات سامنے لاتا ہے، اس خطرے پر کہ کم متعلقہ اقتباسات بھی شامل ہو جائیں۔

اسے یوں ٹیون کریں کہ ایجنٹ شور کھینچے بغیر بھروسے کے ساتھ آپ کا مواد تلاش کرے۔

Top-k

Top-k طے کرتا ہے کہ ایجنٹ ہر سوال کے لیے کتنے بہترین مماثل اقتباسات حاصل کرتا ہے۔

ایک چھوٹا top-k جوابات کو مختصر اور قریب ترین مماثلتوں پر مرکوز رکھتا ہے۔
ایک بڑا top-k ایجنٹ کو کام کرنے کے لیے زیادہ سیاق دیتا ہے، جو وسیع سوالات کے لیے مدد دیتا ہے لیکن جواب کو پتلا کر سکتا ہے۔

ٹپ

محتاط قدروں سے شروع کریں، پھر chat test میں /agent/chat پر حقیقی سوالات کے ساتھ آزمائیں۔ اگر ایجنٹ ایسے جوابات چھوڑ دیتا ہے جو واضح طور پر آپ کے دستاویزات میں ہیں، تو threshold کم کریں یا top-k تھوڑا بڑھائیں؛ اگر یہ غیر متعلقہ مواد کھینچتا ہے، تو اس کے برعکس کریں۔

ایک نظر میں ٹیوننگ

جب ایجنٹ آپ کی مرضی کے مطابق جواب نہیں دے رہا ہو، تو یہ دو علامات اکثر کیسز کا احاطہ کرتی ہیں:

علامت	ممکنہ وجہ	آزمائیں
ایجنٹ کہتا ہے کہ اسے معلوم نہیں، لیکن جواب آپ کے دستاویزات میں ہے	Threshold بہت سخت ہے، یا top-k بہت چھوٹا ہے	similarity threshold کم کریں، یا top-k تھوڑا بڑھائیں
ایجنٹ غیر متعلقہ یا غلط مواد کھینچ لیتا ہے	Threshold بہت ڈھیلا ہے، یا top-k بہت بڑا ہے	similarity threshold بڑھائیں، یا top-k کم کریں

ایک وقت میں ایک ترتیب تبدیل کریں اور دوبارہ آزمائیں، تاکہ آپ بتا سکیں کہ نتیجے کو حقیقت میں کس چیز نے بدلا۔

یہاں RAG کیسے کام کرتا ہے​

لنک کرنے سے پہلے​

ایک knowledge base لنک کریں​

Similarity threshold​

Top-k​

ایک نظر میں ٹیوننگ​

اگلے اقدامات​