ਗਿਆਨ ਅਤੇ RAG
ਪ੍ਰਾਪਤੀ-ਵਧਾਈ ਜਨਰੇਸ਼ਨ (RAG) ਤੁਹਾਡੇ ਏਜੰਟ ਨੂੰ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ ਤੁਹਾਡੇ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਜਵਾਬ ਦੇਣ ਦਿੰਦਾ ਹੈ: ਜਦੋਂ ਕੋਈ ਕਾਲਰ ਕੁਝ ਪੁੱਛਦਾ ਹੈ, ਏਜੰਟ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਪੈਰਾ ਲੱਭਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਤੋਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। RAG ਏਜੰਟ ਬਿਲਡਰ ਵਿੱਚ /agent/setup 'ਤੇ LLM ਟੈਬ ਦੇ Add Knowledge Base ਸੈਕਸ਼ਨ ਵਿੱਚ ਕੌਂਫ਼ਿਗਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ — ਕੋਈ ਵੱਖਰਾ Knowledge ਟੈਬ ਨਹੀਂ ਹੈ।
RAG ਇੱਥੇ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ
ਇੱਕ ਗਿਆਨ ਆਧਾਰ: ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਿਆ, ਇੰਡੈਕਸ ਕੀਤਾ ਅਤੇ ਕਾਲ ਸਮੇਂ ਮੁੜ-ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਨਾਲ ਹੀ ਗੁਣਵੱਤਾ ਅਤੇ ਕਵਰੇਜ ਵਿਸ਼ਲੇਸ਼ਣ।
RAG ਜਵਾਬਾਂ ਨੂੰ ਆਧਾਰਿਤ ਰੱਖਦੀ ਹੈ। ਸਿਰਫ਼ ਉਸ 'ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ ਜੋ ਮਾਡਲ ਪਹਿਲਾਂ ਹੀ ਜਾਣਦਾ ਹੈ, ਏਜੰਟ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਮੇਲ ਖਾਂਦੀ ਸਮੱਗਰੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਇਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਤੁਹਾਡੇ ਉਤਪਾਦਾਂ, ਨੀਤੀਆਂ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ ਬਾਰੇ ਸਹੀ, ਤਾਜ਼ਾ ਜਵਾਬ — ਅਤੇ ਕਿਤੇ ਘੱਟ ਮਨਘੜਤ ਜਵਾਬ।
ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਤੁਸੀਂ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜ ਸਕੋ, ਤੁਹਾਨੂੰ ਇੱਕ ਦੀ ਲੋੜ ਹੈ। ਆਪਣੇ ਦਸਤਾਵੇਜ਼ (PDF, DOCX ਜਾਂ TXT) ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਪ੍ਰਬੰਧਿਤ ਕਰੋ।
ਜੋੜਨ ਤੋਂ ਪਹਿਲਾਂ
RAG ਕੁਝ ਕਰੇ, ਉਸ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਨੂੰ ਉਸ ਵਿੱਚ ਸਮੱਗਰੀ ਵਾਲੇ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਦੀ ਲੋੜ ਹੈ। ਕ੍ਰਮ ਇਹ ਹੈ:
- ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ ਅੱਪਲੋਡ ਅਤੇ ਇੰਡੈਕਸ ਕਰੋ।
- LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਸ ਗਿਆਨ-ਆਧਾਰ ਨੂੰ ਏਜੰਟ ਨਾਲ ਜੋੜੋ।
- ਹੇਠਾਂ ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਅਤੇ top-k ਟਿਊਨ ਕਰੋ।
- ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ ਅਤੇ ਠੀਕ ਕਰੋ।
ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜੋ
LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਹ ਗਿਆਨ-ਆਧਾਰ (ਜਾਂ ਕਈ) ਚੁਣੋ ਜਿਸ ਤੋਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਹ ਏਜੰਟ ਖਿੱਚੇ। ਇੱਕ ਵਾਰ ਜੁੜਨ 'ਤੇ, ਏਜੰਟ ਕਾਲਾਂ ਦੌਰਾਨ ਆਪਣੇ-ਆਪ ਇਸ ਨੂੰ ਖੋਜਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਜੋ ਮਿਲਦਾ ਹੈ ਉਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ
ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਤੈਅ ਕਰਦੀ ਹੈ ਕਿ ਵਰਤੇ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਪੈਰਾ ਕਾਲਰ ਦੇ ਸਵਾਲ ਨਾਲ ਕਿੰਨੇ ਨੇੜੇ ਨਾਲ ਮੇਲ ਖਾਣਾ ਚਾਹੀਦਾ ਹੈ।
- ਇੱਕ ਉੱਚ ਥ੍ਰੈਸ਼ਹੋਲਡ ਸਿਰਫ਼ ਮਜ਼ਬੂਤ ਮੇਲ ਵਾਪਸ ਕਰਦੀ ਹੈ — ਵਧੇਰੇ ਸਟੀਕ, ਪਰ ਏਜੰਟ ਨੂੰ ਢਿੱਲੇ ਸ਼ਬਦਾਂ ਵਾਲੇ ਸਵਾਲਾਂ ਲਈ ਕੁਝ ਨਹੀਂ ਮਿਲ ਸਕਦਾ।
- ਇੱਕ ਘੱਟ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧੇਰੇ ਮਾਫ਼ ਕਰਨ ਵਾਲੀ ਹੈ ਅਤੇ ਵੱਧ ਪੈਰੇ ਪ੍ਰਗਟ ਕਰਦੀ ਹੈ, ਘੱਟ ਢੁਕਵੇਂ ਖਿੱਚਣ ਦੇ ਜੋਖਮ 'ਤੇ।
ਇਸਨੂੰ ਟਿਊਨ ਕਰੋ ਤਾਂ ਜੋ ਏਜੰਟ ਰੌਲਾ ਖਿੱਚੇ ਬਿਨਾਂ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਤੁਹਾਡੀ ਸਮੱਗਰੀ ਲੱਭੇ।
Top-k
Top-k ਤੈਅ ਕਰਦਾ ਹੈ ਕਿ ਏਜੰਟ ਹਰ ਸਵਾਲ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ-ਮੇਲ ਵਾਲੇ ਕਿੰਨੇ ਪੈਰੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।
- ਇੱਕ ਛੋਟਾ top-k ਜਵਾਬਾਂ ਨੂੰ ਕਸਿਆ ਅਤੇ ਨੇੜਲੇ ਮੇਲਾਂ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਰੱਖਦਾ ਹੈ।
- ਇੱਕ ਵੱਡਾ top-k ਏਜੰਟ ਨੂੰ ਕੰਮ ਕਰਨ ਲਈ ਵਧੇਰੇ ਪ੍ਰਸੰਗ ਦਿੰਦਾ ਹੈ, ਜੋ ਵਿਆਪਕ ਸਵਾਲਾਂ ਲਈ ਮਦਦ ਕਰਦਾ ਹੈ ਪਰ ਜਵਾਬ ਨੂੰ ਪਤਲਾ ਕਰ ਸਕਦਾ ਹੈ।
ਸੰਜਮੀ ਮੁੱਲਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਫਿਰ /agent/chat 'ਤੇ ਚੈਟ ਟੈਸਟ ਵਿੱਚ ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ। ਜੇ ਏਜੰਟ ਉਹਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਖੁੰਝਾਉਂਦਾ ਹੈ ਜੋ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹਨ, ਤਾਂ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ; ਜੇ ਇਹ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਦੀ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈ, ਤਾਂ ਉਲਟ ਕਰੋ।
ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਟਿਊਨਿੰਗ
ਜਦੋਂ ਏਜੰਟ ਉਸ ਤਰ੍ਹਾਂ ਜਵਾਬ ਨਹੀਂ ਦੇ ਰਿਹਾ ਜਿਵੇਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਦੋ ਲੱਛਣ ਜ਼ਿਆਦਾਤਰ ਮਾਮਲਿਆਂ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ:
| ਲੱਛਣ | ਸੰਭਾਵੀ ਕਾਰਨ | ਅਜ਼ਮਾਓ |
|---|---|---|
| ਏਜੰਟ ਕਹਿੰਦਾ ਹੈ ਕਿ ਇਹ ਨਹੀਂ ਜਾਣਦਾ, ਪਰ ਜਵਾਬ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹੈ | ਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਸਖ਼ਤ, ਜਾਂ top-k ਬਹੁਤ ਛੋਟਾ | ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ |
| ਏਜੰਟ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਜਾਂ ਗਲਤ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈ | ਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਢਿੱਲੀ, ਜਾਂ top-k ਬਹੁਤ ਵੱਡਾ | ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧਾਓ, ਜਾਂ top-k ਘਟਾਓ |
ਇੱਕ ਵਾਰੀ ਵਿੱਚ ਇੱਕ ਸੈਟਿੰਗ ਬਦਲੋ ਅਤੇ ਮੁੜ-ਟੈਸਟ ਕਰੋ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਦੱਸ ਸਕੋ ਕਿ ਅਸਲ ਵਿੱਚ ਨਤੀਜੇ ਨੂੰ ਕੀ ਬਦਲਿਆ।