El ecosistema de la IA conversacional avanza a un ritmo frenético, pero de vez en cuando surge una actualización que marca un antes y un después. Este junio, ElevenLabs ha lanzado Conversational AI 2.0, una plataforma que promete revolucionar el desarrollo y despliegue de agentes conversacionales de voz. Vamos a desgranar sus novedades, lo que significan a nivel técnico y práctico… y, de paso, anunciar que muchas de estas capacidades llegarán muy pronto a nuestro servicio AI Calls, potenciado por AI Connect.
Una IA que conversa (de verdad): turn-taking model avanzado
Uno de los grandes retos de la voz sintética siempre ha sido el turno de palabra: saber cuándo “interrumpir”, cuándo callar y cuándo responder al instante, sin parecer una grabación o un call center barato. El modelo de turn-taking de ElevenLabs ahora es capaz de detectar micro-pausas, titubeos (“eh…”), y cambios sutiles en la prosodia de la voz humana. Esto se consigue con modelos que analizan el espectrograma de la señal en tiempo real y predicen la intención, no solo el final de la onda sonora.
Muy pronto, esta fluidez estará disponible en nuestro sistema AI Calls para clientes de AI Connect, permitiendo conversaciones mucho más naturales con tus usuarios o clientes.
Cambio automático de idioma
Conversational AI 2.0 reconoce y cambia de idioma al vuelo dentro de una misma llamada, permitiendo a los agentes conversar fluidamente con usuarios que mezclan idiomas o cambian de idioma a mitad de frase.
Tip técnico:
Esta funcionalidad requiere modelos de ASR (Automatic Speech Recognition) y TTS (Text to Speech) multilingües entrenados en datasets mixtos, además de una capa de detección automática de idioma (language identification) en tiempo real.
¿Dónde es clave? En servicios globales y call centers que reciben llamadas de cualquier parte del mundo.
Estamos trabajando para integrar esta capacidad en AI Calls, de modo que tu asistente pueda cambiar de idioma sobre la marcha, atendiendo a usuarios internacionales sin perder ni un segundo en configuración.
Multicharacter mode: un agente, múltiples voces
Ahora puedes dotar a un mismo agente de varias voces, personajes o personalidades distintas, que pueden intervenir dentro de la misma conversación. La arquitectura permite cargar varios modelos de voz (voice cloning) y asignar cada uno a una “entidad” o rol dentro de la conversación, gestionando los turnos y respuestas por contexto.
Multimodalidad real: texto y voz, sin duplicar desarrollo
ElevenLabs permite que un mismo agente funcione tanto en canales de voz como de texto, usando la misma lógica y configuración.
Tip técnico:
Se consigue separando la lógica de diálogo (orquestación y estado conversacional) de la interfaz de entrada/salida (voz o texto), usando pipelines independientes pero interoperables.
Ya disponible en AI Connect:
La experiencia omnicanal ha sido nuestra prioridad: tu asistente telefónico, web, WhatsApp y e-mail responden igual de bien, sea por voz o por texto.
Batch calls: llamadas masivas, cero dolores de cabeza
La nueva plataforma soporta batch calls, es decir, lanzar cientos o miles de llamadas salientes de forma simultánea para campañas, recordatorios o encuestas.
RAG integrado: respuestas actualizadas y fiables
Conversational AI 2.0 integra un módulo de RAG (Retrieval-Augmented Generation), lo que significa que los agentes pueden consultar fuentes externas o bases de conocimiento en tiempo real antes de responder.
Tip técnico:
RAG combina modelos generativos (LLMs tipo GPT) con búsquedas vectoriales o semánticas en bases de datos o documentos, devolviendo respuestas siempre actualizadas y “aterrizadas” en datos reales.
Ya disponible en AI Connect:
Nuestra suite AI Connect ya dispone de integración de RAG para que tus agentes puedan consultar tu base de datos, documentación interna o información relevante. Respuestas contextuales y precisas, siempre.
Preparado para empresas (y regulaciones): HIPAA, EU y seguridad
ElevenLabs da el salto a lo enterprise con cumplimiento HIPAA (salud), normativa de datos en la Unión Europea y robustez en seguridad: cifrado extremo a extremo, controles de acceso avanzados y opciones de integración con los sistemas existentes.
El cumplimiento con HIPAA y las normativas europeas exige no solo encriptación, sino también logs auditables, trazabilidad, control de acceso granular y la opción de borrar datos bajo demanda (right to be forgotten).
¿Quieres probarlo?
Contacta con nosotros y te mostraremos cómo puedes optimizar tu servicio de atención al cliente con AI Connect.
Deja una respuesta