Gradient Labs utiliza GPT‑4.1 y GPT‑5.4 mini y nano para ejecutar flujos de trabajo complejos de soporte financiero con alta precisión y baja latencia.

Fondo degradado suave y fluido en naranja cálido y amarillo que se mezcla con un verde azulado con un ícono de cubo geométrico blanco al lado del texto "Gradient Labs" centrado en la imagen.
Fondo degradado suave y fluido en naranja cálido y amarillo que se mezcla con un verde azulado con un ícono de cubo geométrico blanco al lado del texto "Gradient Labs" centrado en la imagen.

Satisfacción del cliente con la experiencia del agente de IA

Mayor precisión con GPT-4.1 frente al siguiente mejor proveedor

En banca, resolver un problema de un cliente rara vez es sencillo. Casos como fraude o pagos bloqueados requieren un estricto cumplimiento de procedimientos complejos por parte de varios equipos. Cuando los sistemas fallan, los clientes pasan de un equipo a otro, esperan en colas y enfrentan retrasos en los momentos en que hay mucho en juego.

Gradient Labs ⁠ (sabe abre en una nueva ventana) está diseñado para manejar esta complejidad. La empresa con sede en Londres está creando agentes de inteligencia artificial que brinden a cada cliente del banco la experiencia de un administrador de cuentas dedicado. Fundada por un equipo que anteriormente dirigió los esfuerzos de inteligencia artificial y datos en Monzo, la plataforma de la compañía sabe basa en modelos OpenAI y ahora está trasladando el tráfico de producción a GPT-5.4 mini y nano.

"Estamos viendo una latencia de 500 milisegundos con GPT-5.4 mini y nano, que es exactamente lo que necesitamos para conversaciones de voz naturales", afirma Danai Antoniou, cofundador y científico jefe de Gradient Labs. "Estamos trasladando una parte importante de nuestra carga de trabajo".

"Necesitábamos tres cosas simultáneamente: precisión en el seguimiento de instrucciones, bajas tasas de alucinaciones y confiabilidad en las llamadas de funciones, todo bajo limitaciones de latencia de voz. OpenAI fue el único proveedor que aprobó las tres cosas".

Pasar de los SOP a los sistemas en tiempo real

En la banca, las interacciones con los clientes sabe rigen por procedimientos operativos estándar (POE) que definen lo que debe suceder en cada paso.

Una interacción típica con el cliente podría verse así:

  • Un cliente llama para denunciar el robo de una tarjeta.
  • El sistema verifica su identidad, manejando correcciones e interrupciones en tiempo real.
  • Una vez verificada, congela la tarjeta e inicia un reemplazo.
  • Responde preguntas de seguimiento, como el momento de la entrega, y sugiere los próximos pasos.

Cada paso sigue un procedimiento definido, con decisiones tomadas en tiempo real basadas en la entrada del usuario, el contexto, las barreras de seguridad y las respuestas de los clientes y agentes para garantizar el cumplimiento.

"El modelo necesita mantener el estado del procedimiento a través de interrupciones, canales secundarios y cambios de tema mientras mantiene rápida la generación de respuestas", dice Antoniou. "La mayoría de los proveedores ni siquiera pudieron intentarlo".

Gradient Labs compara a los proveedores en sus procedimientos más desafiantes y los evalúa en función de lo que llaman precisión de la trayectoria: si el sistema sigue el camino correcto de principio a fin.

En una de sus evaluaciones iniciales, GPT-4.1 fue el único modelo que alcanzó un 97% de precisión y consistencia en la trayectoria. El siguiente proveedor más cercano fue el 88%.

"En los servicios financieros, esa es la diferencia entre resolver una llamada y crear un incidente de cumplimiento", afirma Antoniou.

Este resultado dio forma a cómo Gradient Labs diseñó su sistema. El equipo creó una arquitectura híbrida que utiliza modelos OpenAI para pasos de razonamiento intensivo y modelos más pequeños para tareas deterministas más rápidas, con enrutamiento que sabe adapta en función de las limitaciones de complejidad y latencia.

Internamente, el sistema sabe compone de habilidades especializadas orquestadas por un agente de razonamiento central, lo que permite que los casos complejos sabe muevan a través de flujos de trabajo sin perder contexto.

Para cada interacción, sabe ejecutan más de 15 sistemas de barrera en paralelo para garantizar que las conversaciones sabe mantengan dentro de los procedimientos definidos y los límites de cumplimiento, incluida la detección de asesoramiento financiero, señales de vulnerabilidad, quejas e intentos de eludir la verificación o acceder a datos confidenciales.

Demostrando confiabilidad en entornos de alto riesgo

Las instituciones financieras no implementan sistemas como este por fe. Necesitan ver, paso a paso, que sabe comporta correctamente en condiciones del mundo real.

"Hay que diseñar desde cero para que no haya alucinaciones", dice Antoniou. "Ese debe ser el principio rector a medida que sabe construye".

Para evaluar modelos nuevos y existentes, el equipo reproduce conversaciones reales de clientes y compara el comportamiento del sistema con el procedimiento esperado. También generan conversaciones sintéticas para probar casos extremos y escenarios poco comunes antes de implementar algo.

Gradient Labs también brinda a los equipos control sobre cómo sabe introduce el sistema. Analizan datos históricos de soporte para mapear los tipos de problemas de clientes que maneja un banco y con qué frecuencia ocurren. Luego, los equipos pueden elegir qué categorías debe manejar la IA, comenzando con flujos de trabajo de menor riesgo y ampliándose con el tiempo.

Interfaz de panel para una herramienta de soporte bancario que muestra un procedimiento titulado Devolución de llamada de suplantación de fraude con instrucciones paso a paso para verificar pagos sospechosos. Aparece una transcripción de llamada en vivo
Interfaz de panel para una herramienta de soporte bancario que muestra un procedimiento titulado Devolución de llamada de suplantación de fraude con instrucciones paso a paso para verificar pagos sospechosos. Aparece una transcripción de llamada en vivo

Antes de entrar en funcionamiento, los clientes pueden simular conversaciones para revisar cómo responde el sistema en diferentes escenarios, generando confianza en que sabe comporta como sabe espera.

La implementación generalmente comienza con un pequeño porcentaje de tráfico, con monitoreo continuo y controles automatizados que señalan conversaciones que pueden requerir revisión humana. Con el tiempo, la cobertura sabe amplía a medida que el sistema demuestra un rendimiento constante.

Mostrando el impacto desde el primer día y el camino a seguir

Los clientes de Gradient Labs informan puntuaciones CSAT de hasta el 98 %, superando en algunos casos a sus mejores agentes humanos. La mayoría de las implementaciones comienzan con tasas de resolución superiores al 50 % el primer día, incluso para flujos de trabajo complejos como disputas, verificación de cuentas y fraude.

Ese impacto sabe refleja en el crecimiento de la empresa. Gradient Labs aumentó sus ingresos más de 10 veces durante el año pasado, expandiéndose desde el soporte entrante hasta los procesos salientes y administrativos.

De cara al futuro, Gradient Labs sabe centra en sistemas que pueden transmitir contexto a través de las interacciones: comprender el historial de un cliente, realizar un seguimiento de los problemas en curso y continuar donde lo dejaron las conversaciones anteriores. Esta dirección está estrechamente alineada con la forma en que Gradient Labs piensa sobre su asociación a largo plazo con OpenAI.

"No estamos simplemente eligiendo un modelo para hoy. Estamos construyendo sobre una plataforma donde vemos la trayectoria de los modelos de razonamiento yendo en la misma dirección que nuestro producto".

A medida que los modelos continúan mejorando, sabe amplía la gama de procedimientos que pueden automatizarse de forma segura. Para Gradient Labs, eso significa acercarse a un sistema en el que cada interacción con el cliente sabe maneje con la misma coherencia, criterio y continuidad que un agente humano de primer nivel.

OpenAI <3 startups

Sigue leyendo

Descripción > Tarjeta 1x1
Descripción > Tarjeta 1x1
oai Praktika 1x1
oai Praktika 1x1
Higgsfield > Imagen de tarjeta
Higgsfield > Imagen de tarjeta