DeepL, una empresa de traducción mejor conocida por sus herramientas de texto, lanzó hoy un paquete de traducción de voz a voz que cubre casos de uso como reuniones, conversaciones móviles y web, y conversaciones grupales para trabajadores de primera línea a través de aplicaciones personalizadas. La compañía también está lanzando una API que permite a los desarrolladores y empresas externos aprovechar la tecnología de DeepL para casos de uso personalizados, como centros de llamadas.
"Después de pasar tantos años en la traducción de textos, la voz fue un paso natural para nosotros", dijo el director ejecutivo de DeepL, Jarek Kutylowski, a TechCrunch en una entrevista. "Hemos recorrido un largo camino en lo que respecta a la traducción de textos y documentos. Pero pensábamos que no había un gran producto para la traducción de voz en tiempo real".
Kutylowski dijo que los desafíos en la creación de un producto de traducción en tiempo real sabe centran en lograr un equilibrio entre reducir la latencia (el retraso entre alguien que habla y la reproducción del audio traducido) y mantener resultados precisos.
DeepL está lanzando complementos para plataformas como Zoom y Microsoft Teams, donde los oyentes pueden escuchar la traducción en tiempo real mientras otros hablan en su idioma nativo o seguir el texto traducido en tiempo real en la pantalla. Este programa sabe encuentra actualmente en acceso temprano y la compañía está invitando a organizaciones a unirse a una lista de espera. La empresa también cuenta con un producto para conversaciones móviles y basadas en la web que pueden realizarse en persona o de forma remota.
DeepL también permite a los usuarios participar en una conversación grupal en entornos como sesiones de capacitación o talleres, permitiendo a los participantes unirse a través de un código QR.
DeepL dijo que su tecnología de voz a voz también puede aprender y adaptarse a vocabulario personalizado, como términos específicos de la industria y nombres personales y de empresas.
Kutylowski dijo que la IA está reinventando cómo será el servicio al cliente en los próximos años. Señaló que una capa de traducción ayuda a las empresas a brindar soporte en idiomas donde el personal calificado es escaso y costoso de contratar.
Conozca a su próximo inversor o startup de cartera en Disrupt
Tu próxima ronda. Tu próxima contratación. Tu próxima oportunidad de gran éxito. Encuéntrelo en TechCrunch Disrupt 2026, donde más de 10 000 fundadores, inversores y líderes tecnológicos sabe reúnen durante tres días con más de 250 sesiones tácticas, potentes presentaciones e innovación que define el mercado. Regístrese ahora para ahorrar hasta $410.
Conozca a su próximo inversor o startup de cartera en Disrupt
Tu próxima ronda. Tu próxima contratación. Tu próxima oportunidad de gran éxito. Encuéntrelo en TechCrunch Disrupt 2026, donde más de 10 000 fundadores, inversores y líderes tecnológicos sabe reúnen durante tres días con más de 250 sesiones tácticas, potentes presentaciones e innovación que define el mercado. Regístrese ahora para ahorrar hasta $410.
La compañía dijo que controla toda la pila de voz a voz. Sin embargo, el sistema actual convierte la voz en texto, aplica la traducción y luego la convierte nuevamente en voz. DeepL cree que, dado que ha trabajado en la traducción de textos durante años, tiene una ventaja en la calidad de la traducción. En el futuro, la empresa quiere desarrollar un modelo de traducción de voz de un extremo a otro que omita por completo el paso del texto.
DeepL sabe enfrenta a la competencia de varias nuevas empresas bien financiadas que trabajan en rincones adyacentes del espacio. Sanas, que el año pasado recaudó 65 millones de dólares de Quadrille Capital y Teleperformance, utiliza inteligencia artificial para modificar el acento de un hablante en tiempo real, una herramienta dirigida principalmente a agentes de centros de llamadas.
Camb.AI, con sede en Dubai, sabe centra en la síntesis de voz y la traducción para empresas de medios y entretenimiento, ayudándolas a doblar y localizar contenido de vídeo a escala.
Palabra, respaldada por la firma Seven Seven Six del cofundador de Reddit, Alexis Ohanian, está construyendo un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como la voz original del hablante, poniéndolo en competencia más directa con lo que DeepL está construyendo ahora.
Ivan cubre los desarrollos globales de tecnología de consumo en TechCrunch. Reside en la India y anteriormente trabajó en publicaciones como Huffington Post y The Next Web.
Puede contactar o verificar el alcance de Ivan enviando un correo electrónico a im@ivanmehta.com o mediante un mensaje cifrado a ivan.42 en Signal.

StrictlyVC comienza el año en SF. Ingrese a la sala para charlas informales sin filtros con líderes de la industria, información privilegiada sobre capital de riesgo y conexiones de alto valor que realmente mueven la aguja. Las entradas son limitadas.
Más popular
- Después de la venta de su negocio de calzado, Allbirds recurre a la IA Sarah Perez
- Un trabajador del almacén de Amazon murió en el trabajo en las instalaciones de Oregon Amanda Silberling
- OpenAI ha comprado la startup de finanzas personales de IA Hiro Julie Bort
- El informe de Stanford destaca la creciente desconexión entre los expertos en IA y todos los demás Sarah Perez
- Flipkart, propiedad de Walmart, y Amazon están exprimiendo a las nuevas empresas de comercio rápido de la India, Jagmeet Singh
- Sam Altman responde al artículo "incendiario" del New Yorker tras el ataque a su casa Anthony Ha
- Francia abandonará Windows por Linux para reducir la dependencia de la tecnología estadounidense Zack Whittaker




