NeuTTS Air: modelo de voz open source que opera en dispositivos sin internet

02/10/2025

Neuphonic presenta NeuTTS Air, un modelo de lenguaje de voz realista de código abierto que opera localmente en dispositivos sin requerir servidores GPU ni conexión a internet, con capacidad de clonación instantánea de voz.

NeuTTS Air: modelo de voz open source que opera en dispositivos sin internet

Neuphonic ha lanzado NeuTTS Air como proyecto de código abierto, un modelo de lenguaje de voz que funciona directamente en dispositivos locales. A diferencia de los sistemas de síntesis de voz avanzados que tradicionalmente han estado disponibles solo a través de APIs en la nube, este modelo opera completamente sin conexión a internet. La compañía indica que se trata del primer modelo de síntesis de voz con estas características de realismo capaz de ejecutarse completamente en el propio dispositivo del usuario.

El modelo está construido sobre Qwen 0.5B, un modelo de lenguaje ligero optimizado para comprensión y generación de texto, combinado con NeuCodec, el códec de audio neural propietario de Neuphonic. Esta arquitectura permite que el sistema funcione en tiempo real incluso en dispositivos de gama media, incluyendo ordenadores portátiles, teléfonos móviles y placas Raspberry Pi. La compañía ha distribuido NeuTTS Air en formato GGML, diseñado específicamente para permitir la inferencia eficiente en dispositivos sin requerir hardware especializado.

Una de las características destacadas del sistema es la clonación instantánea de voz, que permite crear un perfil de voz personalizado con tan solo tres segundos de audio de referencia. Esta funcionalidad opera completamente en el dispositivo local, lo que significa que los datos de voz nunca se transmiten a servidores externos. Neuphonic señala que esta aproximación aborda preocupaciones sobre privacidad y cumplimiento normativo, especialmente relevantes en aplicaciones que manejan datos sensibles.

El modelo genera voces con un alto grado de naturalidad para su tamaño, equilibrando la calidad del audio con la velocidad de procesamiento y los requisitos de almacenamiento. La arquitectura combina un modelo de lenguaje compacto con un códec de audio que logra alta calidad con tasas de bits reducidas mediante el uso de un único libro de códigos. Según la compañía, este equilibrio permite aplicaciones en tiempo real en dispositivos con recursos limitados.

NeuTTS Air está disponible gratuitamente en Hugging Face bajo licencia de código abierto. Las salidas de audio del modelo incluyen marcas de agua para facilitar su identificación. Neuphonic indica que el consumo energético del sistema ha sido optimizado específicamente para dispositivos móviles y embebidos, permitiendo su uso en aplicaciones que van desde asistentes de voz hasta juguetes interactivos y herramientas que requieren cumplimiento estricto de normativas de privacidad.

Puntos clave

  • NeuTTS Air opera completamente en dispositivos locales sin conexión a internet.
  • Los datos de voz se mantienen en el propio dispositivo para garantizar privacidad y cumplimiento normativo.
  • Publicado como código abierto gratuito en Hugging Face.
  • El sistema permite clonación instantánea de voz con solo tres segundos de audio de referencia.
  • Está construido sobre Qwen 0.5B y utiliza NeuCodec, el códec de audio neural propietario de Neuphonic.
  • Funciona en tiempo real en dispositivos de gama media, incluyendo portátiles, móviles y Raspberry Pi.
  • Las salidas de audio incluyen marcas de agua para su identificación.

Vídeos

IA relacionada

Neuphonic

Síntesis de voz para dispositivos

Empresa de síntesis de voz que genera habla natural para dispositivos mediante inteligencia artificial. Ofrece servicios mediante API cloud y modelos compactos on-device. Incluye capacidades de ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.