Skip to main content

AI വോയ്സ് ഏജന്റുകൾ

ഒരു ഏജന്റ് എന്നത് നിങ്ങളുടെ ഓർഗനൈസേഷനു വേണ്ടി ഫോൺ കോളുകൾ ചെയ്യുകയും സ്വീകരിക്കുകയും ചെയ്യുന്ന ഒറ്റ AI വോയ്സ് വ്യക്തിത്വമാണ്. ഇതിന് സ്വന്തമായി ഭാഷാ മോഡൽ, വോയ്സ്, ഗ്രീറ്റിംഗ്, പെരുമാറ്റം, tools എന്നിവയുണ്ട് — ഒരു കോൾ എങ്ങനെ കേൾക്കപ്പെടുമെന്നും ഏജന്റിന് എന്ത് ചെയ്യാമെന്നും തീരുമാനിക്കുന്ന എല്ലാം. /agent/setup-ലെ ഏജന്റ് ബിൽഡറിൽ നിങ്ങൾ ഏജന്റുകൾ നിർമ്മിക്കുകയും ട്യൂൺ ചെയ്യുകയും ചെയ്യുന്നു, പിന്നെ അവ ടെസ്റ്റ് ചെയ്ത് പ്രസിദ്ധീകരിക്കുന്നു. ഈ പേജ് ഏജന്റ് എന്ന ആശയം വിശദീകരിക്കുകയും ഓരോ ബിൽഡർ ടാബും അതിന്റെ ഡോക്യുമെന്റേഷനുമായി ബന്ധിപ്പിക്കുകയും ചെയ്യുന്നു.

ഒരു ഏജന്റ് എന്നാൽ എന്താണ്

ഓരോ ഏജന്റും ഇവ ഒരുമിച്ച് ചേർക്കുന്നു:

  • സംഭാഷണത്തെ നയിക്കുന്ന ഒരു ഭാഷാ മോഡൽ;
  • സംസാരിക്കുന്ന ഒരു വോയ്സ്, കേൾക്കുന്ന ഒരു ട്രാൻസ്ക്രൈബർ;
  • അതിന്റെ വ്യക്തിത്വവും വേഗവും രൂപപ്പെടുത്തുന്ന ഒരു സിസ്റ്റം പ്രോംപ്റ്റ്, ഗ്രീറ്റിംഗ്, പെരുമാറ്റം;
  • ഇൻബൗണ്ട്, ഔട്ട്ബൗണ്ട് ഉപയോഗത്തിനുള്ള കോളിംഗ് ക്രമീകരണങ്ങൾ; കൂടാതെ
  • നിങ്ങളുടെ ഡോക്യുമെന്റുകളിൽ നിന്ന് ഉത്തരം നൽകാനും യഥാർത്ഥ പ്രവർത്തനങ്ങൾ ചെയ്യാനും ഓപ്ഷണലായ knowledge, tools എന്നിവ.

ഏജന്റുകൾ പ്രോജക്റ്റുകൾക്കുള്ളിൽ ജീവിക്കുന്നു, അവലോകനത്തിലെ Organization → Projects → Agents ഘടന പിന്തുടരുന്നു. ഒരു ഏജന്റ് പ്രസിദ്ധീകരിച്ചുകഴിഞ്ഞാൽ നിങ്ങൾക്ക് campaigns-ഉം ഇൻബൗണ്ട് നമ്പറുകളും അതിലേക്ക് ചൂണ്ടിക്കാട്ടാം.

ബിൽഡർ ടാബ് മോഡൽ

ഏജന്റ് ബിൽഡറും അതിന്റെ ടാബുകളും ഏജന്റ് ബിൽഡർ. മുകളിലുള്ള ടാബുകൾ (Agent, Model, Voice, Behavior, Calling, Tools, Workflow, Guardrails, Channels) ഓരോന്നും ഏജന്റിന്റെ ഓരോ ഭാഗം കോൺഫിഗർ ചെയ്യുന്നു.

/agent/setup-ലെ ബിൽഡർ ക്രമീകരണത്തെ ടാബുകളായി ക്രമീകരിക്കുന്നു. നിങ്ങൾ മുകളിൽ നിന്ന് താഴേക്ക് അവയിലൂടെ നീങ്ങുന്നു, പോകുമ്പോൾ സേവ് ചെയ്യുന്നു. ചുവടെയുള്ള ഓരോ ടാബിനും അതിന്റേതായ ഡോക്യുമെന്റേഷൻ പേജുണ്ട്:

  • Agent — പേര്, വിവരണം, ഉപയോഗ സന്ദർഭം, ആരംഭ ടെംപ്ലേറ്റ്. ഓരോ പുതിയ ഏജന്റും ആരംഭിക്കുന്നത് ഇവിടെയാണ്; നിങ്ങളുടെ ആദ്യ ഏജന്റ് സൃഷ്ടിക്കുക കാണുക.
  • LLM — Azure OpenAI മോഡൽ, temperature, ടോക്കൺ പരിധികൾ, ഒരു fallback മോഡൽ.
  • Audio (വോയ്സും ഓഡിയോയും) — Deepgram speech-to-text (ഭാഷ, വിരാമചിഹ്നം, diarization, ഇഷ്ടാനുസൃത പദസമ്പത്ത്, PII redaction), Azure text-to-speech (വോയ്സ്, stability, style, speed, pitch, emotion, ഉച്ചാരണങ്ങൾ).
  • Engine (സംഭാഷണ പെരുമാറ്റം) — സിസ്റ്റം പ്രോംപ്റ്റ്, ഗ്രീറ്റിംഗ്, end/fallback/voicemail സന്ദേശങ്ങൾ, barge-in സെൻസിറ്റിവിറ്റി, നിശ്ശബ്ദതയും timeout കൈകാര്യം ചെയ്യലും, filler വാക്കുകൾ.
  • Calling — ഇൻബൗണ്ട്/ഔട്ട്ബൗണ്ട്, പരമാവധി ദൈർഘ്യം, auto-hangup, cold/warm കോൾ ട്രാൻസ്ഫർ.
  • Knowledge — ഒരു knowledge base ലിങ്ക് ചെയ്യുക, RAG സാമ്യതയും top-k-ഉം ട്യൂൺ ചെയ്യുക.
  • Tools — ഏജന്റിന് functions നൽകുകയും MCP servers ബന്ധിപ്പിക്കുകയും ചെയ്യുക.

ചില ഏജന്റുകൾ ഈ ടാബുകളും ഉപയോഗിക്കുന്നു:

  • Channels — ഇമെയിൽ വഴി ഫോളോ-അപ്പ് ചെയ്യുന്ന ഏജന്റുകൾക്കുള്ള ഇമെയിൽ സജ്ജീകരണം, SMTP, അയയ്ക്കൽ പരിധികൾ.
  • Calendar — ഏജന്റിന് ലഭ്യതയുമായി പ്രവർത്തിക്കാൻ OAuth വഴി Google അല്ലെങ്കിൽ Outlook ബന്ധിപ്പിക്കുക.
  • Analytics — ഈ പ്രത്യേക ഏജന്റിന്റെ പ്രകടനം.

വർക്ക്ഫ്ലോ ബിൽഡർ

Workflow ടാബ് ഒരു വിഷ്വൽ കോൾ-ഫ്ലോ ബിൽഡർ തുറക്കുന്നു (Tools ടാബിലെ Open Workflow Builder ബട്ടൺ ഉപയോഗിച്ച് ലോഞ്ച് ചെയ്യുന്നു). തുറന്ന സംഭാഷണത്തിന് പകരം ഒരു സ്ക്രിപ്റ്റ് ചെയ്ത പാത ആവശ്യമുള്ള ഏജന്റുകൾക്കായി നിർണ്ണായക, നോഡ്-അധിഷ്ഠിത കോൾ ഫ്ലോകൾ — ചോദ്യങ്ങൾ, വ്യവസ്ഥകൾ, ടൂൾ കോളുകൾ, വെബ്ഹുക്കുകൾ, ട്രാൻസ്ഫറുകൾ — രൂപകൽപ്പന ചെയ്യാൻ ഇത് നിങ്ങളെ അനുവദിക്കുന്നു.

ഫംഗ്ഷൻ ലോഗുകൾ

Function Logs ടാബ് യഥാർത്ഥ കോളുകൾക്കിടെ ഏജന്റിന്റെ ബൈൻഡ് ചെയ്ത ഫംഗ്ഷനുകൾ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് കാണിക്കുന്നു: ഓരോ ഫംഗ്ഷനും എത്ര തവണ വിളിക്കപ്പെടുന്നു, അതിന്റെ latency, ഏതെങ്കിലും പിശകുകൾ എന്നിവ. ഒരു മന്ദഗതിയിലുള്ള അല്ലെങ്കിൽ പരാജയപ്പെടുന്ന ടൂൾ കോൾ ഗുണനിലവാരത്തെ ബാധിക്കുന്നതിന് മുമ്പ് കണ്ടെത്താൻ ഇത് ഉപയോഗിക്കുക.

ഗാർഡ്റെയിലുകൾ

Guardrails ടാബ് ഏജന്റിനെ സുരക്ഷിതവും അനുസരണയുള്ളതുമായി നിലനിർത്തുന്നു. ഇത് നിയന്ത്രിക്കുന്നത്:

  • Content guardrails — ഏജന്റ് ഒഴിവാക്കുകയും അതിൽ നിന്ന് വഴിതിരിച്ചുവിടുകയും ചെയ്യുന്ന നിരോധിത വിഷയങ്ങളുടെ ഒരു പട്ടിക.
  • PII handling — ട്രാൻസ്ക്രിപ്റ്റുകളിൽ വ്യക്തിഗതമായി തിരിച്ചറിയാവുന്ന വിവരങ്ങൾ എങ്ങനെ കൈകാര്യം ചെയ്യപ്പെടുന്നു (mask, redact അല്ലെങ്കിൽ allow), കൂടാതെ ഓരോ തരത്തിലുമുള്ള transcript PII redaction പിക്കർ (SSN, ക്രെഡിറ്റ് കാർഡ്, ഇമെയിൽ, ഫോൺ, വിലാസം, ജനന തീയതി, ബാങ്ക് അക്കൗണ്ട്).
  • Compliance modeStandard, Strict, HIPAA അല്ലെങ്കിൽ PCI-DSS; കർശനമായ മോഡുകൾ അധിക സുരക്ഷാ നടപടികളും ലോഗിംഗും പ്രവർത്തനക്ഷമമാക്കുന്നു.
  • Data collection — ഏജന്റ് ക്യാപ്ചർ ചെയ്യാൻ ശ്രമിക്കുന്ന collected fields-ഉം അത് നേടേണ്ട required fields-ഉം (നഷ്ടപ്പെട്ടാൽ വിളിക്കുന്നയാളോട് ചോദിക്കുന്നു).
  • Post-call analysis — ഓപ്റ്റ്-ഇൻ auto-summarize, sentiment analysis, intent detection എന്നിവ.
tip

ആരംഭിക്കാൻ നിങ്ങൾ എല്ലാ ടാബുകളും പൂരിപ്പിക്കേണ്ടതില്ല. ഒരു പേര്, ഒരു മോഡൽ, ഒരു വോയ്സ്, ഒരു ഗ്രീറ്റിംഗ് എന്നിവ ആദ്യ ടെസ്റ്റിന് മതിയാകും. അടിസ്ഥാന കാര്യങ്ങൾ ശരിയായി കേൾക്കാൻ തുടങ്ങിയാൽ knowledge-ഉം tools-ഉം ചേർക്കുക.

പ്രസിദ്ധീകരിക്കുന്നതിന് മുമ്പ് ടെസ്റ്റ് ചെയ്യുക

യഥാർത്ഥ കോളുകൾ സ്പർശിക്കുന്നതിന് മുമ്പ് ഒരു ഏജന്റ് പരീക്ഷിക്കാൻ ബിൽഡർ രണ്ട് ടെസ്റ്റ് സർഫേസുകളുമായി ജോടിയാക്കുന്നു:

  • /agent/interface-ലെ വോയ്സ് ടെസ്റ്റ് — ഏജന്റിനോട് സംസാരിക്കുകയും അത് പ്രതികരിക്കുന്നത് കേൾക്കുകയും ചെയ്യുക.
  • /agent/chat-ലെ ചാറ്റ് ടെസ്റ്റ് — ലോജിക്കും പ്രോംപ്റ്റുകളും വേഗത്തിൽ പരിശോധിക്കാൻ ടെക്സ്റ്റ് ടേണുകൾ കൈമാറുക.

ഒഴിഞ്ഞ ഏജന്റിൽ നിന്ന് പ്രസിദ്ധീകരിച്ച ഒന്നിലേക്കുള്ള പൂർണ്ണ പാത നിങ്ങളുടെ ആദ്യ ഏജന്റ് സൃഷ്ടിക്കുക-ൽ ഉണ്ട്.

അടുത്ത ഘട്ടങ്ങൾ