Agentes de voz con IA
Un agente es una única persona de voz con IA que realiza y contesta llamadas telefónicas para tu organización. Tiene su propio modelo de lenguaje, voz, saludo, comportamiento y herramientas — todo lo que decide cómo suena una llamada y qué puede hacer el agente. Construyes y ajustas agentes en el constructor de agentes en /agent/setup, luego los pruebas y publicas. Esta página explica el concepto de agente y mapea cada pestaña del constructor a su documentación.
Qué es un agente
Cada agente agrupa:
- un pipeline de voz y modelo de lenguaje que impulsan la conversación;
- una voz que habla y un transcriptor que escucha;
- un prompt del sistema, saludo y mensajes clave que dan forma a su personalidad y a cómo abre y cierra una llamada;
- el comportamiento del motor que controla el ritmo — interrupciones, silencio y turnos;
- ajustes de llamada para uso entrante y saliente;
- conocimiento y herramientas opcionales para que pueda responder a partir de tus documentos y tomar acciones reales; y
- barreras de seguridad y canales para el cumplimiento y para llegar a las personas en apps de mensajería.
Los agentes viven dentro de proyectos, siguiendo la estructura Organización → Proyectos → Agentes de la visión general. Una vez publicado un agente, puedes apuntar campañas y números entrantes hacia él.
El modelo de pestañas del constructor
El constructor de agentes. Las pestañas en la parte superior (Agent, Model, Voice, Behavior, Calling, Tools, Workflow, Guardrails, Channels) configuran cada una una parte del agente.
El constructor en /agent/setup organiza la configuración en once pestañas. Las recorres de izquierda a derecha, guardando a medida que avanzas. Las pestañas centrales tienen cada una su propia página de documentación:
- Agente — nombre, descripción, caso de uso y plantilla de partida, además del prompt del sistema, el saludo y los mensajes de fin / respaldo / ocupado / buzón de voz, y los interruptores Publicado y Activo. Aquí es donde comienza cada nuevo agente; consulta Crea tu primer agente.
- LLM — el modo de pipeline de voz, el proveedor y modelo de LLM, la temperatura, los límites de tokens, los parámetros avanzados, un modelo de respaldo y la vinculación de RAG / base de conocimiento (consulta Conocimiento y RAG).
- Audio (Voz y audio) — voz a texto y texto a voz multiproveedor (proveedor, modelo, voz y ajuste específico del proveedor).
- Motor (Comportamiento de la conversación) — barge-in y manejo de interrupciones, relleno de detección de actividad de voz, retardo de respuesta, manejo del silencio y muletillas.
- Llamadas — entrante/saliente, duración máxima, corte automático, números asignados y webhooks.
- Herramientas — vincula las funciones del agente, conecta servidores MCP y abre el Constructor de Flujo de trabajo.
- Calendario — conecta Google u Outlook mediante OAuth para que el agente pueda trabajar con la disponibilidad.
- Flujo de trabajo — un constructor visual de flujo de llamadas (cubierto abajo), lanzado desde la pestaña Herramientas.
- Registros de funciones — métricas por función: recuentos de llamadas, latencia y errores de las funciones que usa este agente.
- Barreras de seguridad — controles de cumplimiento y recopilación de datos (cubiertos abajo).
- Canales — llega a las personas en apps de mensajería: WhatsApp, Telegram, Facebook Messenger y un widget web incrustable.
Constructor de Flujo de trabajo
La pestaña Flujo de trabajo abre un constructor visual de flujo de llamadas (lanzado con el botón Abrir Constructor de Flujo de trabajo en la pestaña Herramientas). Te permite diseñar flujos de llamada deterministas basados en nodos — preguntas, condiciones, llamadas a herramientas, webhooks y transferencias — para agentes que necesitan un camino guionizado en lugar de una conversación abierta.
Registros de funciones
La pestaña Registros de funciones muestra cómo se desempeñan las funciones vinculadas del agente durante llamadas reales: con qué frecuencia se llama cada función, su latencia y cualquier error. Úsala para detectar una herramienta lenta o fallida antes de que perjudique la calidad de la llamada.
Barreras de seguridad
La pestaña Barreras de seguridad mantiene al agente seguro y conforme. Controla:
- Barreras de contenido — una lista de temas prohibidos que el agente evita y de los que redirige.
- Manejo de PII — cómo se trata la información de identificación personal en las transcripciones (enmascarar, redactar o permitir), además de un selector de redacción de PII en transcripciones por tipo (SSN, tarjeta de crédito, correo, teléfono, dirección, fecha de nacimiento, cuenta bancaria).
- Modo de cumplimiento — Estándar, Estricto, HIPAA o PCI-DSS; los modos más estrictos habilitan medidas de seguridad y registro adicionales.
- Recopilación de datos — los campos recopilados que el agente intenta capturar y los campos obligatorios que debe obtener (preguntando a quien llama si faltan).
- Análisis post-llamada — autorresumen, análisis de sentimiento y detección de intención opcionales.
La pestaña Canales es para apps de mensajería — WhatsApp, Telegram, Facebook Messenger y un widget web. El seguimiento por correo no es un canal: es la función send_email en la pestaña Herramientas.
No tienes que rellenar cada pestaña para empezar. Un nombre, un modelo, una voz y un saludo bastan para una primera prueba. Agrega conocimiento y herramientas una vez que lo básico suene bien.
Prueba antes de publicar
El constructor se combina con dos superficies de prueba para que pruebes un agente antes de que toque llamadas reales:
- Prueba de voz en /agent/interface — habla con el agente y escúchalo responder.
- Prueba de chat en /agent/chat — intercambia turnos de texto para comprobar la lógica y los prompts rápidamente.
El camino completo desde un agente en blanco hasta uno publicado está en Crea tu primer agente.