ਗਿਆਨ ਅਤੇ RAG

ਪ੍ਰਾਪਤੀ-ਵਧਾਈ ਜਨਰੇਸ਼ਨ (RAG) ਤੁਹਾਡੇ ਏਜੰਟ ਨੂੰ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ ਤੁਹਾਡੇ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਜਵਾਬ ਦੇਣ ਦਿੰਦਾ ਹੈ: ਜਦੋਂ ਕੋਈ ਕਾਲਰ ਕੁਝ ਪੁੱਛਦਾ ਹੈ, ਏਜੰਟ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਪੈਰਾ ਲੱਭਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਤੋਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। RAG ਏਜੰਟ ਬਿਲਡਰ ਵਿੱਚ /agent/setup 'ਤੇ LLM ਟੈਬ ਦੇ Add Knowledge Base ਸੈਕਸ਼ਨ ਵਿੱਚ ਕੌਂਫ਼ਿਗਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ — ਕੋਈ ਵੱਖਰਾ Knowledge ਟੈਬ ਨਹੀਂ ਹੈ।

RAG ਇੱਥੇ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ

RAG ਨਾਲ ਇੱਕ ਗਿਆਨ ਅਧਾਰ ਇੱਕ ਗਿਆਨ ਆਧਾਰ: ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਿਆ, ਇੰਡੈਕਸ ਕੀਤਾ ਅਤੇ ਕਾਲ ਸਮੇਂ ਮੁੜ-ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਨਾਲ ਹੀ ਗੁਣਵੱਤਾ ਅਤੇ ਕਵਰੇਜ ਵਿਸ਼ਲੇਸ਼ਣ।

RAG ਜਵਾਬਾਂ ਨੂੰ ਆਧਾਰਿਤ ਰੱਖਦੀ ਹੈ। ਸਿਰਫ਼ ਉਸ 'ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ ਜੋ ਮਾਡਲ ਪਹਿਲਾਂ ਹੀ ਜਾਣਦਾ ਹੈ, ਏਜੰਟ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਮੇਲ ਖਾਂਦੀ ਸਮੱਗਰੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਇਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਤੁਹਾਡੇ ਉਤਪਾਦਾਂ, ਨੀਤੀਆਂ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ ਬਾਰੇ ਸਹੀ, ਤਾਜ਼ਾ ਜਵਾਬ — ਅਤੇ ਕਿਤੇ ਘੱਟ ਮਨਘੜਤ ਜਵਾਬ।

ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਤੁਸੀਂ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜ ਸਕੋ, ਤੁਹਾਨੂੰ ਇੱਕ ਦੀ ਲੋੜ ਹੈ। ਆਪਣੇ ਦਸਤਾਵੇਜ਼ (PDF, DOCX ਜਾਂ TXT) ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਪ੍ਰਬੰਧਿਤ ਕਰੋ।

ਜੋੜਨ ਤੋਂ ਪਹਿਲਾਂ

RAG ਕੁਝ ਕਰੇ, ਉਸ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਨੂੰ ਉਸ ਵਿੱਚ ਸਮੱਗਰੀ ਵਾਲੇ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਦੀ ਲੋੜ ਹੈ। ਕ੍ਰਮ ਇਹ ਹੈ:

ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ ਅੱਪਲੋਡ ਅਤੇ ਇੰਡੈਕਸ ਕਰੋ।
LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਸ ਗਿਆਨ-ਆਧਾਰ ਨੂੰ ਏਜੰਟ ਨਾਲ ਜੋੜੋ।
ਹੇਠਾਂ ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਅਤੇ top-k ਟਿਊਨ ਕਰੋ।
ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ ਅਤੇ ਠੀਕ ਕਰੋ।

ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜੋ

LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਹ ਗਿਆਨ-ਆਧਾਰ (ਜਾਂ ਕਈ) ਚੁਣੋ ਜਿਸ ਤੋਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਹ ਏਜੰਟ ਖਿੱਚੇ। ਇੱਕ ਵਾਰ ਜੁੜਨ 'ਤੇ, ਏਜੰਟ ਕਾਲਾਂ ਦੌਰਾਨ ਆਪਣੇ-ਆਪ ਇਸ ਨੂੰ ਖੋਜਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਜੋ ਮਿਲਦਾ ਹੈ ਉਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।

ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ

ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਤੈਅ ਕਰਦੀ ਹੈ ਕਿ ਵਰਤੇ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਪੈਰਾ ਕਾਲਰ ਦੇ ਸਵਾਲ ਨਾਲ ਕਿੰਨੇ ਨੇੜੇ ਨਾਲ ਮੇਲ ਖਾਣਾ ਚਾਹੀਦਾ ਹੈ।

ਇੱਕ ਉੱਚ ਥ੍ਰੈਸ਼ਹੋਲਡ ਸਿਰਫ਼ ਮਜ਼ਬੂਤ ਮੇਲ ਵਾਪਸ ਕਰਦੀ ਹੈ — ਵਧੇਰੇ ਸਟੀਕ, ਪਰ ਏਜੰਟ ਨੂੰ ਢਿੱਲੇ ਸ਼ਬਦਾਂ ਵਾਲੇ ਸਵਾਲਾਂ ਲਈ ਕੁਝ ਨਹੀਂ ਮਿਲ ਸਕਦਾ।
ਇੱਕ ਘੱਟ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧੇਰੇ ਮਾਫ਼ ਕਰਨ ਵਾਲੀ ਹੈ ਅਤੇ ਵੱਧ ਪੈਰੇ ਪ੍ਰਗਟ ਕਰਦੀ ਹੈ, ਘੱਟ ਢੁਕਵੇਂ ਖਿੱਚਣ ਦੇ ਜੋਖਮ 'ਤੇ।

ਇਸਨੂੰ ਟਿਊਨ ਕਰੋ ਤਾਂ ਜੋ ਏਜੰਟ ਰੌਲਾ ਖਿੱਚੇ ਬਿਨਾਂ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਤੁਹਾਡੀ ਸਮੱਗਰੀ ਲੱਭੇ।

Top-k

Top-k ਤੈਅ ਕਰਦਾ ਹੈ ਕਿ ਏਜੰਟ ਹਰ ਸਵਾਲ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ-ਮੇਲ ਵਾਲੇ ਕਿੰਨੇ ਪੈਰੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।

ਇੱਕ ਛੋਟਾ top-k ਜਵਾਬਾਂ ਨੂੰ ਕਸਿਆ ਅਤੇ ਨੇੜਲੇ ਮੇਲਾਂ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਰੱਖਦਾ ਹੈ।
ਇੱਕ ਵੱਡਾ top-k ਏਜੰਟ ਨੂੰ ਕੰਮ ਕਰਨ ਲਈ ਵਧੇਰੇ ਪ੍ਰਸੰਗ ਦਿੰਦਾ ਹੈ, ਜੋ ਵਿਆਪਕ ਸਵਾਲਾਂ ਲਈ ਮਦਦ ਕਰਦਾ ਹੈ ਪਰ ਜਵਾਬ ਨੂੰ ਪਤਲਾ ਕਰ ਸਕਦਾ ਹੈ।

tip

ਸੰਜਮੀ ਮੁੱਲਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਫਿਰ /agent/chat 'ਤੇ ਚੈਟ ਟੈਸਟ ਵਿੱਚ ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ। ਜੇ ਏਜੰਟ ਉਹਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਖੁੰਝਾਉਂਦਾ ਹੈ ਜੋ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹਨ, ਤਾਂ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ; ਜੇ ਇਹ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਦੀ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈ, ਤਾਂ ਉਲਟ ਕਰੋ।

ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਟਿਊਨਿੰਗ

ਜਦੋਂ ਏਜੰਟ ਉਸ ਤਰ੍ਹਾਂ ਜਵਾਬ ਨਹੀਂ ਦੇ ਰਿਹਾ ਜਿਵੇਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਦੋ ਲੱਛਣ ਜ਼ਿਆਦਾਤਰ ਮਾਮਲਿਆਂ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ:

ਲੱਛਣ	ਸੰਭਾਵੀ ਕਾਰਨ	ਅਜ਼ਮਾਓ
ਏਜੰਟ ਕਹਿੰਦਾ ਹੈ ਕਿ ਇਹ ਨਹੀਂ ਜਾਣਦਾ, ਪਰ ਜਵਾਬ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹੈ	ਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਸਖ਼ਤ, ਜਾਂ top-k ਬਹੁਤ ਛੋਟਾ	ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ
ਏਜੰਟ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਜਾਂ ਗਲਤ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈ	ਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਢਿੱਲੀ, ਜਾਂ top-k ਬਹੁਤ ਵੱਡਾ	ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧਾਓ, ਜਾਂ top-k ਘਟਾਓ

ਇੱਕ ਵਾਰੀ ਵਿੱਚ ਇੱਕ ਸੈਟਿੰਗ ਬਦਲੋ ਅਤੇ ਮੁੜ-ਟੈਸਟ ਕਰੋ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਦੱਸ ਸਕੋ ਕਿ ਅਸਲ ਵਿੱਚ ਨਤੀਜੇ ਨੂੰ ਕੀ ਬਦਲਿਆ।

RAG ਇੱਥੇ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ​

ਜੋੜਨ ਤੋਂ ਪਹਿਲਾਂ​

ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜੋ​

ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ​

Top-k​

ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਟਿਊਨਿੰਗ​

ਅਗਲੇ ਕਦਮ​