نموذج اللغة (LLM)
تقرّر علامة تبويب LLM كيف يفكّر وكيلك وكيف يُربط خط أنابيب صوته. تتحكم في وضع خط أنابيب الصوت (كيف يتلاءم تحويل الكلام إلى نص ونموذج اللغة وتحويل النص إلى كلام)، وأي مزوّد LLM ونموذج يقود المحادثة، ومعاملات التوليد، ونموذج احتياطي، وربط RAG / قاعدة المعرفة. اضبط هذا في منشئ الوكلاء على /agent/setup.
وضع خط أنابيب الصوت
علامة التبويب Model: اختر وضع Voice Pipeline — Azure Realtime أو Cartesia Sonic أو Gemini Realtime، أو Pipeline منفصلاً بنمط STT→LLM→TTS.
هذا أهم إعداد على علامة التبويب — يتحكم في كيفية ربط STT وLLM وTTS معًا أثناء مكالمة. اختر أحد أربعة أوضاع:
- Azure Realtime (افتراضي) — يتولّى Azure اكتشاف نشاط الصوت وتحويل الكلام إلى نص وLLM عبر WebSocket واحد باستخدام نشر
gpt-4o-realtime-preview. تُتجاهَل إعدادات STT على علامة تبويب الصوت؛ ومزوّد TTS منفصل يُنتِج الصوت. - Cartesia Sonic — خط أنابيب يستخدم Sonic TTS منخفض الكمون للغاية من Cartesia، مع أي LLM وSTT من Azure/Groq.
- Gemini Realtime — يتولّى Google Gemini Live اكتشاف نشاط الصوت وSTT وLLM أصلًا، مع دعم قوي للغات الهندية. يمكنه التحدّث بصوته الخاص (Native Audio) أو إخراج نص لـ TTS المهيّأ لديك (Hybrid).
- Pipeline (STT → LLM → TTS) — مزوّدون منفصلون لكل مرحلة، مهيّأون بشكل مستقل. استخدم هذا عندما تريد تحكمًا كاملًا في المُحوِّل والنموذج والصوت.
يتطلب كل وضع realtime عائلة محددة من النماذج، ويُمرَّر النموذج مباشرة إلى مزوّد realtime — تفشل قيمة غير متوافقة وقت المكالمة. عندما تبدّل الأوضاع يضبط المنشئ نموذجًا متوافقًا تلقائيًا، وعند الحفظ يوفّق النموذج مع الوضع. على وجه الخصوص، نموذج دردشة بسيط مثل gpt-4 غير صالح لوضع Azure Realtime الافتراضي ويُعاد كتابته عند الحفظ؛ اختر نشر realtime لأوضاع realtime، ونموذج إكمال دردشة لـ Pipeline / Cartesia Sonic.
اختر المزوّد والنموذج
خارج أوضاع realtime المُدارة بالكامل، تختار مزوّد LLM ثم نموذجًا لذلك المزوّد. تعرض قائمة المزوّدين فقط المزوّدين الذين مكّنت مؤسستك بيانات اعتمادهم (مهيّأة في الإعدادات). حسب ما هو مُمكَّن، يمكن أن يشمل ذلك Azure OpenAI وGoogle Gemini وGroq وOpenRouter وSarvam.
- بالنسبة لـ Azure، تأتي خيارات النموذج من عمليات النشر المهيّأة لديك (كل بيانات اعتماد هي نشر واحد).
- بالنسبة للمزوّدين بمفتاح واحد، تأتي قائمة النموذج من كتالوج نماذج المنصة.
اختر النموذج الذي يناسب المهمة: النماذج الأعلى قدرة تفكّر بشكل أفضل في المكالمات المعقّدة، بينما النماذج الأخفّ تستجيب أسرع وتكلّف أقل لكل مكالمة. بالنسبة لمعظم وكلاء الاتصال، يهم الكمون بقدر الجودة الخام.
معاملات النموذج
يتحكم قسم Model Parameters في التوليد:
- الرموز — يحدّد كم يولّد النموذج لكل دور. أبقِه متواضعًا حتى لا يثرثر الوكيل في مكالمة هاتفية.
- درجة الحرارة — كم تتنوّع الردود. منخفضة للمكالمات المكتوبة الحساسة للامتثال؛ أعلى للتواصل الحواري.
- Top P — حدّ قطع أخذ عيّنات النواة، طريقة بديلة للتحكم في التنوّع.
- عقوبة التكرار وعقوبة الحضور — تثبّطان التكرار وتشجّعان النموذج على تقديم مواضيع جديدة.
الإعدادات المتقدّمة
يضيف قسم Advanced Settings عناصر تحكم تشغيلية:
- المهلة (ms) — كم تنتظر النموذج قبل الاستسلام عن دور.
- عدد المحاولات وتأخير المحاولة (ms) — كيف يعيد الوكيل محاولة طلب فاشل.
- تنسيق الاستجابة — Text أو JSON.
- تمكين البثّ — بثّ الرموز أثناء توليدها (مشغّل افتراضيًا) لكمون مُدرَك أقل.
- وضع JSON — فرض مخرَج JSON منظَّم.
- تتبّع التكلفة — تسجيل إنفاق الرموز لهذا الوكيل.
يمكنك أيضًا تزويد معاملات مزوّد إضافية كـ JSON خام ضمن Custom Parameters.
النموذج الاحتياطي
اضبط مزوّدًا ونموذجًا احتياطيين حتى تستمر المكالمات في العمل إذا كان الأساسي غير متاح. إذا تعذّر على الأساسي الاستجابة، يستخدم الوكيل الاحتياطي بدلًا من إسقاط المحادثة — أبسط طريقة لجعل وكيل مرنًا.
قاعدة المعرفة وRAG
يُهيّأ التوليد المعزَّز بالاسترجاع هنا، على علامة تبويب LLM، في قسم Add Knowledge Base. شغّل RAG Enabled، واختر قاعدة معرفة واحدة أو أكثر، واضبط RAG Top K (كم عدد المقاطع التي تُسترجَع) وعتبة التشابه (كم يجب أن يطابق مقطع عن قرب). انظر المعرفة وRAG لكيفية ضبط هذه وكيفية بناء قاعدة معرفة أولًا.
تتبّع الاستخدام والتكلفة
يستهلك استخدام النموذج رصيدًا من الرصيد المدفوع مسبقًا لمؤسستك. لرؤية الاستهلاك والإنفاق عبر وكلائك، استخدم الفوترة — تُظهِر النظرة العامة الخطة والاستخدام، وتُظهِر المحفظة رصيدك المدفوع مسبقًا وعمليات الشحن والسجل. اختيار نماذج فعّالة وحدود رموز معقولة هو أكثر الطرق مباشرةً للتحكم في التكلفة.