ElevenLabs presenta Scribe v2, un modelo de transcripción que mejora la precisión en audio extenso y ofrece detección automática de entidades, soporte multilingüe y funciones diseñadas para flujos de trabajo empresariales.
ElevenLabs ha anunciado el lanzamiento de Scribe v2, su nuevo modelo de transcripción diseñado para procesar audio por lotes, generar subtítulos y crear transcripciones a escala. El modelo incorpora mejoras en la estabilidad y precisión respecto a la versión anterior, con un mejor manejo de audios extensos, pausas, cambios de tono y silencios prolongados.
Scribe v2 está optimizado para grabaciones largas y complejas, manteniendo la precisión en diferentes locutores, acentos y estilos de presentación. Según datos de la compañía, el modelo alcanza la tasa de error de palabras más baja registrada en los estándares de evaluación del sector.
Entre las funcionalidades destacadas se encuentra el keyterm prompting, un sistema que permite seleccionar hasta 100 palabras o frases específicas. El modelo utiliza el contexto para decidir cuándo transcribir estos términos, lo que resulta útil en dominios técnicos, nombres de marca y lenguaje especializado.
El modelo incorpora detección nativa de entidades para análisis estructurado de audio. Los usuarios pueden seleccionar hasta 56 categorías que incluyen información personal identificable, datos de salud o información de pagos. Scribe v2 detecta automáticamente estas instancias y registra sus marcas de tiempo exactas.
El sistema soporta flujos de trabajo multilingües de forma automática, procesando archivos que contienen múltiples idiomas y detectando cada uno sin necesidad de segmentación manual. El modelo ofrece soporte para más de 90 idiomas.
La versión incluye características adicionales orientadas a casos empresariales: identificación inteligente de hablantes, marcas de tiempo a nivel de palabra, etiquetado dinámico de audio que detecta eventos no verbales, y cumplimiento con estándares SOC 2, ISO 27001, PCI DSS L1, HIPAA y GDPR. También ofrece residencia de datos en la Unión Europea e India.
Scribe v2 está disponible en ElevenLabs Studio y a través de la API de la plataforma, permitiendo a desarrolladores y empresas automatizar procesos de audio complejos.
Explora el software de clonación de voz y conversión de texto a voz más avanzado de la historia. Crea locuciones realistas para tus contenidos o utiliza nuestro generador de voz AI como un lector ...
02/03/2026
El fabricante de Claude rechaza eliminar dos restricciones de uso de su IA para el ejército, en un conflicto que llevó a Trump a ordenar su cese en ...
25/02/2026
Perplexity presenta Computer, un agente de IA capaz de crear y ejecutar flujos de trabajo completos durante horas o meses, coordinando de forma ...
23/02/2026
Anthropic ha identificado campañas a gran escala de DeepSeek, Moonshot y MiniMax para extraer de forma fraudulenta las capacidades de su modelo ...
21/02/2026
El AI Impact Summit 2026 concluye con un acuerdo voluntario suscrito por 88 países que fija las bases para una cooperación internacional en torno ...