Skip to main content

ਗਿਆਨ ਅਤੇ RAG

ਪ੍ਰਾਪਤੀ-ਵਧਾਈ ਜਨਰੇਸ਼ਨ (RAG) ਤੁਹਾਡੇ ਏਜੰਟ ਨੂੰ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ ਤੁਹਾਡੇ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਜਵਾਬ ਦੇਣ ਦਿੰਦਾ ਹੈ: ਜਦੋਂ ਕੋਈ ਕਾਲਰ ਕੁਝ ਪੁੱਛਦਾ ਹੈ, ਏਜੰਟ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਪੈਰਾ ਲੱਭਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਤੋਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। RAG ਏਜੰਟ ਬਿਲਡਰ ਵਿੱਚ /agent/setup 'ਤੇ LLM ਟੈਬ ਦੇ Add Knowledge Base ਸੈਕਸ਼ਨ ਵਿੱਚ ਕੌਂਫ਼ਿਗਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ — ਕੋਈ ਵੱਖਰਾ Knowledge ਟੈਬ ਨਹੀਂ ਹੈ।

RAG ਇੱਥੇ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ

RAG ਨਾਲ ਇੱਕ ਗਿਆਨ ਅਧਾਰ ਇੱਕ ਗਿਆਨ ਆਧਾਰ: ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਿਆ, ਇੰਡੈਕਸ ਕੀਤਾ ਅਤੇ ਕਾਲ ਸਮੇਂ ਮੁੜ-ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਨਾਲ ਹੀ ਗੁਣਵੱਤਾ ਅਤੇ ਕਵਰੇਜ ਵਿਸ਼ਲੇਸ਼ਣ।

RAG ਜਵਾਬਾਂ ਨੂੰ ਆਧਾਰਿਤ ਰੱਖਦੀ ਹੈ। ਸਿਰਫ਼ ਉਸ 'ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ ਜੋ ਮਾਡਲ ਪਹਿਲਾਂ ਹੀ ਜਾਣਦਾ ਹੈ, ਏਜੰਟ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਤੋਂ ਮੇਲ ਖਾਂਦੀ ਸਮੱਗਰੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਇਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਤੁਹਾਡੇ ਉਤਪਾਦਾਂ, ਨੀਤੀਆਂ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ ਬਾਰੇ ਸਹੀ, ਤਾਜ਼ਾ ਜਵਾਬ — ਅਤੇ ਕਿਤੇ ਘੱਟ ਮਨਘੜਤ ਜਵਾਬ।

ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਤੁਸੀਂ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜ ਸਕੋ, ਤੁਹਾਨੂੰ ਇੱਕ ਦੀ ਲੋੜ ਹੈ। ਆਪਣੇ ਦਸਤਾਵੇਜ਼ (PDF, DOCX ਜਾਂ TXT) ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਪ੍ਰਬੰਧਿਤ ਕਰੋ।

ਜੋੜਨ ਤੋਂ ਪਹਿਲਾਂ

RAG ਕੁਝ ਕਰੇ, ਉਸ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਨੂੰ ਉਸ ਵਿੱਚ ਸਮੱਗਰੀ ਵਾਲੇ ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਦੀ ਲੋੜ ਹੈ। ਕ੍ਰਮ ਇਹ ਹੈ:

  1. ਗਿਆਨ-ਆਧਾਰ ਵਿੱਚ ਆਪਣੇ ਦਸਤਾਵੇਜ਼ ਅੱਪਲੋਡ ਅਤੇ ਇੰਡੈਕਸ ਕਰੋ।
  2. LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਸ ਗਿਆਨ-ਆਧਾਰ ਨੂੰ ਏਜੰਟ ਨਾਲ ਜੋੜੋ
  3. ਹੇਠਾਂ ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਅਤੇ top-k ਟਿਊਨ ਕਰੋ।
  4. ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ ਅਤੇ ਠੀਕ ਕਰੋ।

ਇੱਕ ਗਿਆਨ-ਆਧਾਰ ਜੋੜੋ

LLM ਟੈਬ 'ਤੇ, RAG Enabled ਚਾਲੂ ਕਰੋ ਅਤੇ ਉਹ ਗਿਆਨ-ਆਧਾਰ (ਜਾਂ ਕਈ) ਚੁਣੋ ਜਿਸ ਤੋਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਹ ਏਜੰਟ ਖਿੱਚੇ। ਇੱਕ ਵਾਰ ਜੁੜਨ 'ਤੇ, ਏਜੰਟ ਕਾਲਾਂ ਦੌਰਾਨ ਆਪਣੇ-ਆਪ ਇਸ ਨੂੰ ਖੋਜਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇਣ ਲਈ ਜੋ ਮਿਲਦਾ ਹੈ ਉਸਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।

ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ

ਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਤੈਅ ਕਰਦੀ ਹੈ ਕਿ ਵਰਤੇ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਪੈਰਾ ਕਾਲਰ ਦੇ ਸਵਾਲ ਨਾਲ ਕਿੰਨੇ ਨੇੜੇ ਨਾਲ ਮੇਲ ਖਾਣਾ ਚਾਹੀਦਾ ਹੈ।

  • ਇੱਕ ਉੱਚ ਥ੍ਰੈਸ਼ਹੋਲਡ ਸਿਰਫ਼ ਮਜ਼ਬੂਤ ਮੇਲ ਵਾਪਸ ਕਰਦੀ ਹੈ — ਵਧੇਰੇ ਸਟੀਕ, ਪਰ ਏਜੰਟ ਨੂੰ ਢਿੱਲੇ ਸ਼ਬਦਾਂ ਵਾਲੇ ਸਵਾਲਾਂ ਲਈ ਕੁਝ ਨਹੀਂ ਮਿਲ ਸਕਦਾ।
  • ਇੱਕ ਘੱਟ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧੇਰੇ ਮਾਫ਼ ਕਰਨ ਵਾਲੀ ਹੈ ਅਤੇ ਵੱਧ ਪੈਰੇ ਪ੍ਰਗਟ ਕਰਦੀ ਹੈ, ਘੱਟ ਢੁਕਵੇਂ ਖਿੱਚਣ ਦੇ ਜੋਖਮ 'ਤੇ।

ਇਸਨੂੰ ਟਿਊਨ ਕਰੋ ਤਾਂ ਜੋ ਏਜੰਟ ਰੌਲਾ ਖਿੱਚੇ ਬਿਨਾਂ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਤੁਹਾਡੀ ਸਮੱਗਰੀ ਲੱਭੇ।

Top-k

Top-k ਤੈਅ ਕਰਦਾ ਹੈ ਕਿ ਏਜੰਟ ਹਰ ਸਵਾਲ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ-ਮੇਲ ਵਾਲੇ ਕਿੰਨੇ ਪੈਰੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।

  • ਇੱਕ ਛੋਟਾ top-k ਜਵਾਬਾਂ ਨੂੰ ਕਸਿਆ ਅਤੇ ਨੇੜਲੇ ਮੇਲਾਂ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਰੱਖਦਾ ਹੈ।
  • ਇੱਕ ਵੱਡਾ top-k ਏਜੰਟ ਨੂੰ ਕੰਮ ਕਰਨ ਲਈ ਵਧੇਰੇ ਪ੍ਰਸੰਗ ਦਿੰਦਾ ਹੈ, ਜੋ ਵਿਆਪਕ ਸਵਾਲਾਂ ਲਈ ਮਦਦ ਕਰਦਾ ਹੈ ਪਰ ਜਵਾਬ ਨੂੰ ਪਤਲਾ ਕਰ ਸਕਦਾ ਹੈ।
tip

ਸੰਜਮੀ ਮੁੱਲਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਫਿਰ /agent/chat 'ਤੇ ਚੈਟ ਟੈਸਟ ਵਿੱਚ ਅਸਲ ਸਵਾਲਾਂ ਨਾਲ ਟੈਸਟ ਕਰੋ। ਜੇ ਏਜੰਟ ਉਹਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਖੁੰਝਾਉਂਦਾ ਹੈ ਜੋ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹਨ, ਤਾਂ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ; ਜੇ ਇਹ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਦੀ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈ, ਤਾਂ ਉਲਟ ਕਰੋ।

ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਟਿਊਨਿੰਗ

ਜਦੋਂ ਏਜੰਟ ਉਸ ਤਰ੍ਹਾਂ ਜਵਾਬ ਨਹੀਂ ਦੇ ਰਿਹਾ ਜਿਵੇਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਦੋ ਲੱਛਣ ਜ਼ਿਆਦਾਤਰ ਮਾਮਲਿਆਂ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ:

ਲੱਛਣਸੰਭਾਵੀ ਕਾਰਨਅਜ਼ਮਾਓ
ਏਜੰਟ ਕਹਿੰਦਾ ਹੈ ਕਿ ਇਹ ਨਹੀਂ ਜਾਣਦਾ, ਪਰ ਜਵਾਬ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਹੈਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਸਖ਼ਤ, ਜਾਂ top-k ਬਹੁਤ ਛੋਟਾਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਘਟਾਓ, ਜਾਂ top-k ਥੋੜ੍ਹਾ ਵਧਾਓ
ਏਜੰਟ ਵਿਸ਼ੇ ਤੋਂ ਬਾਹਰ ਜਾਂ ਗਲਤ ਸਮੱਗਰੀ ਖਿੱਚਦਾ ਹੈਥ੍ਰੈਸ਼ਹੋਲਡ ਬਹੁਤ ਢਿੱਲੀ, ਜਾਂ top-k ਬਹੁਤ ਵੱਡਾਸਮਾਨਤਾ ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਧਾਓ, ਜਾਂ top-k ਘਟਾਓ

ਇੱਕ ਵਾਰੀ ਵਿੱਚ ਇੱਕ ਸੈਟਿੰਗ ਬਦਲੋ ਅਤੇ ਮੁੜ-ਟੈਸਟ ਕਰੋ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਦੱਸ ਸਕੋ ਕਿ ਅਸਲ ਵਿੱਚ ਨਤੀਜੇ ਨੂੰ ਕੀ ਬਦਲਿਆ।

ਅਗਲੇ ਕਦਮ