तुमचा पहिला एजंट तयार करा
हा एक AI व्हॉइस एजंट तयार करण्याचा एंड-टू-एंड मार्ग आहे: तो तयार करा, बिल्डर टॅब कॉन्फिगर करा, आवाज आणि चॅटमध्ये त्याची चाचणी करा, मग प्रकाशित करा. प्रत्येक टॅबचे स्वतःचे सखोल पृष्ठ आहे — हे पृष्ठ त्यांना तुम्ही प्रत्यक्षात ज्या क्रमाने काम कराल त्या क्रमात एकत्र बांधते.
तुम्ही सुरू करण्यापूर्वी
- तुम्हाला एजंट तयार करण्याची परवानगी असलेले एक खाते आवश्यक आहे — प्रकल्पासाठी एक org_admin किंवा एक project_manager. भूमिका पहा.
- एजंट कोणत्या प्रकल्पाशी संबंधित आहे ते ठरवा, कारण प्रकल्प टाइमझोन आणि locale सेट करतो. प्रकल्प पहा.
पायरी 1 — एजंट तयार करा
Agent टॅब: नाव, प्रोजेक्ट, वर्णन, सिस्टम प्रॉम्प्ट आणि थेट प्रॉम्प्ट-स्ट्रेंथ विश्लेषण.
एजंट बिल्डर /agent/setup वर उघडा आणि Agent टॅबवर सुरुवात करा. इथेच एजंटची ओळख आणि तो जे शब्द बोलतो ते राहतात.
- एजंटला एक स्पष्ट नाव द्या.
- तो काय करतो याचे एक लहान वर्णन जोडा.
- तुमच्या ध्येयाशी जुळणारे वापर प्रकरण निवडा.
- एखादे बसत असेल तर सुरुवात करण्यासाठी एक टेम्पलेट निवडा — टेम्पलेट तुम्ही नंतर बदलू शकता अशा समजूतदार सेटिंग्ज पूर्व-भरतात.
- सिस्टम प्रॉम्प्ट लिहा — एजंट कोण आहे आणि त्याने काय केले पाहिजे ते परिभाषित करणारा मूळ सूचना संच.
- अभिवादन (कॉल जोडल्यावरची पहिली ओळ) आणि end, fallback, busy आणि voicemail संदेश सेट करा.
एजंट तयार करण्यासाठी जतन करा. आता तुम्ही उर्वरित टॅबमधून पुढे जाऊ शकता.
सिस्टम प्रॉम्प्ट, अभिवादन आणि मुख्य संदेश सर्व Agent टॅबवर आहेत — Engine टॅबवर नाही. Engine टॅब गती सुधारतो (व्यत्यय, शांतता, भरणारे शब्द), एजंट काय बोलतो ते नाही.
पायरी 2 — मुख्य टॅब कॉन्फिगर करा
टॅबमधून खाली काम करा, जात असताना जतन करत. पहिल्या आवृत्तीसाठी तुम्हाला प्रत्येक टॅबची गरज नाही — खालील चार आवश्यक गोष्टी आहेत.
भाषा मॉडेल
LLM टॅबवर, प्रथम व्हॉइस पाइपलाइन मोड निवडा (तो संपूर्ण कॉल चालवतो), मग LLM प्रदाता आणि मॉडेल निवडा, temperature, टोकन मर्यादा आणि एक fallback मॉडेल सेट करा. हे एजंट कसा तर्क करतो आणि किती सुसंगत ऐकू येतो ते ठरवते.
आवाज आणि ऑडिओ
Voice & audio टॅबवर, एजंट कसा ऐकतो आणि बोलतो ते निवडा: एक speech-to-text प्रदाता आणि मॉडेल आणि एक text-to-speech प्रदाता, मॉडेल आणि आवाज निवडा, मग प्रदाता-विशिष्ट नियंत्रणे सुधारा.
संभाषण वर्तन
Engine टॅबवर, गती सुधारा: barge-in आणि व्यत्यय हाताळणी, voice-activity-detection पॅडिंग, प्रतिसाद विलंब, शांतता हाताळणी आणि भरणारे शब्द. सिस्टम प्रॉम्प्ट, अभिवादन आणि संदेश परत Agent टॅबवर सेट केले जातात.
कॉलिंग
Calling टॅबवर, इनबाउंड आणि आउटबाउंड वापर, कमाल कॉल कालावधी, ऑटो-हँगअप, नियुक्त नंबर आणि वेबहुक सेट करा. (कॉल ट्रान्सफर स्वतंत्रपणे कॉन्फिगर केले जाते, Tools → Workflow "Transfer Call" फंक्शनद्वारे.)
पायरी 3 — ज्ञान आणि साधने जोडा (ऐच्छिक)
एकदा मूलभूत गोष्टी योग्य ऐकू आल्या की, एजंट अधिक सक्षम करा:
- ज्ञान आणि RAG — LLM टॅबवर, RAG चालू करा, एक ज्ञान आधार जोडा जेणेकरून एजंट तुमच्या स्वतःच्या दस्तऐवजांमधून उत्तर देतो, आणि similarity आणि top-k सुधारा.
- साधने आणि MCP — एजंटला कार्ये द्या, MCP सर्व्हर जोडा, आणि Workflow Builder मध्ये कॉल फ्लो डिझाइन करा जेणेकरून तो कॉल दरम्यान खऱ्या क्रिया करू शकेल.
स्तरांत तयार करा. प्रथम आवाज आणि अभिवादन योग्य करा, एका चाचणीत त्याची पुष्टी करा, मग ज्ञान आणि साधने जोडा. तुम्ही एका वेळी एक क्षमता जोडता तेव्हा काय बदलले ते सांगणे खूप सोपे असते.
पायरी 4 — एजंटची चाचणी करा
एजंटची खऱ्या कॉलना स्पर्श करण्यापूर्वी चाचणी करा. पोर्टल तुम्हाला दोन चाचणी पृष्ठभाग देतो:
- /agent/interface वर Voice test — एजंटशी बोला आणि तुम्ही कॉन्फिगर केलेल्या आवाज आणि वर्तनासह त्याला प्रतिसाद देताना ऐका.
- /agent/chat वर Chat test — आवाज न वापरता प्रॉम्प्ट आणि लॉजिक जलद तपासण्यासाठी मजकूर वळणे देवाणघेवाण करा.
पुनरावृत्ती करा: एक टॅब समायोजित करा, जतन करा, आणि तो तुम्हाला हव्या त्या पद्धतीने ऐकू येईपर्यंत आणि वागेपर्यंत पुन्हा चाचणी करा.
पायरी 5 — प्रकाशित करा आणि एजंटला कामाला लावा
जेव्हा एजंट तुमच्या चाचण्या उत्तीर्ण होतो, तेव्हा त्याला प्रकाशित करा. प्रकाशन हा एक स्वतंत्र प्रवाह नाही — Agent टॅबवर, Published टॉगल चालू करा (आणि Active टॉगलही चालू असल्याची खात्री करा). एक प्रकाशित, सक्रिय एजंट खऱ्या कॉलवर वापरण्यासाठी तयार आहे. तिथून:
- आउटबाउंड कॉल चालवण्यासाठी त्याच्याकडे एक मोहीम निर्देशित करा, किंवा
- इनबाउंड कॉल हाताळण्यासाठी त्याला नियुक्त करा (कॉलिंग आणि टेलिफोनी पहा).
एजंट हाताळतो तो प्रत्येक कॉल कॉल लॉग आणि विश्लेषण मध्ये रेकॉर्ड आणि विश्लेषित केला जातो, जिथे तुम्हाला तुमच्या पुढील सुधारणा फेरीला मार्गदर्शन करण्यासाठी रेकॉर्डिंग, ट्रान्सक्रिप्ट, AI सारांश आणि भावना सापडतील.