ElevenLabs renueva su modelo de transcripción con Scribe v2

09/01/2026

ElevenLabs presenta Scribe v2, un modelo de transcripción que mejora la precisión en audio extenso y ofrece detección automática de entidades, soporte multilingüe y funciones diseñadas para flujos de trabajo empresariales.

ElevenLabs renueva su modelo de transcripción con Scribe v2

ElevenLabs ha anunciado el lanzamiento de Scribe v2, su nuevo modelo de transcripción diseñado para procesar audio por lotes, generar subtítulos y crear transcripciones a escala. El modelo incorpora mejoras en la estabilidad y precisión respecto a la versión anterior, con un mejor manejo de audios extensos, pausas, cambios de tono y silencios prolongados.

Scribe v2 está optimizado para grabaciones largas y complejas, manteniendo la precisión en diferentes locutores, acentos y estilos de presentación. Según datos de la compañía, el modelo alcanza la tasa de error de palabras más baja registrada en los estándares de evaluación del sector.

Entre las funcionalidades destacadas se encuentra el keyterm prompting, un sistema que permite seleccionar hasta 100 palabras o frases específicas. El modelo utiliza el contexto para decidir cuándo transcribir estos términos, lo que resulta útil en dominios técnicos, nombres de marca y lenguaje especializado.

El modelo incorpora detección nativa de entidades para análisis estructurado de audio. Los usuarios pueden seleccionar hasta 56 categorías que incluyen información personal identificable, datos de salud o información de pagos. Scribe v2 detecta automáticamente estas instancias y registra sus marcas de tiempo exactas.

El sistema soporta flujos de trabajo multilingües de forma automática, procesando archivos que contienen múltiples idiomas y detectando cada uno sin necesidad de segmentación manual. El modelo ofrece soporte para más de 90 idiomas.

La versión incluye características adicionales orientadas a casos empresariales: identificación inteligente de hablantes, marcas de tiempo a nivel de palabra, etiquetado dinámico de audio que detecta eventos no verbales, y cumplimiento con estándares SOC 2, ISO 27001, PCI DSS L1, HIPAA y GDPR. También ofrece residencia de datos en la Unión Europea e India.

Scribe v2 está disponible en ElevenLabs Studio y a través de la API de la plataforma, permitiendo a desarrolladores y empresas automatizar procesos de audio complejos.

Puntos clave

  • Scribe v2 alcanza la tasa de error de palabras más baja en los estándares de evaluación del sector
  • El sistema keyterm prompting permite seleccionar hasta 100 palabras o frases específicas para transcripción contextual
  • Incorpora detección automática de entidades en 56 categorías, incluyendo datos personales, de salud y de pagos
  • Soporta transcripción automática de audio con múltiples idiomas sin configuración manual
  • Ofrece soporte para más de 90 idiomas diferentes
  • Incluye identificación inteligente de hablantes y marcas de tiempo a nivel de palabra
  • Cumple con estándares SOC 2, ISO 27001, PCI DSS L1, HIPAA y GDPR
  • Disponible en ElevenLabs Studio y a través de API para automatización empresarial

Vídeos

IA relacionada

ElevenLabs

Generación de voz IA

Explora el software de clonación de voz y conversión de texto a voz más avanzado de la historia. Crea locuciones realistas para tus contenidos o utiliza nuestro generador de voz AI como un lector ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.