Neuphonic presenta NeuTTS Air, un modelo de lenguaje de voz realista de código abierto que opera localmente en dispositivos sin requerir servidores GPU ni conexión a internet, con capacidad de clonación instantánea de voz.
Neuphonic ha lanzado NeuTTS Air como proyecto de código abierto, un modelo de lenguaje de voz que funciona directamente en dispositivos locales. A diferencia de los sistemas de síntesis de voz avanzados que tradicionalmente han estado disponibles solo a través de APIs en la nube, este modelo opera completamente sin conexión a internet. La compañía indica que se trata del primer modelo de síntesis de voz con estas características de realismo capaz de ejecutarse completamente en el propio dispositivo del usuario.
El modelo está construido sobre Qwen 0.5B, un modelo de lenguaje ligero optimizado para comprensión y generación de texto, combinado con NeuCodec, el códec de audio neural propietario de Neuphonic. Esta arquitectura permite que el sistema funcione en tiempo real incluso en dispositivos de gama media, incluyendo ordenadores portátiles, teléfonos móviles y placas Raspberry Pi. La compañía ha distribuido NeuTTS Air en formato GGML, diseñado específicamente para permitir la inferencia eficiente en dispositivos sin requerir hardware especializado.
Una de las características destacadas del sistema es la clonación instantánea de voz, que permite crear un perfil de voz personalizado con tan solo tres segundos de audio de referencia. Esta funcionalidad opera completamente en el dispositivo local, lo que significa que los datos de voz nunca se transmiten a servidores externos. Neuphonic señala que esta aproximación aborda preocupaciones sobre privacidad y cumplimiento normativo, especialmente relevantes en aplicaciones que manejan datos sensibles.
El modelo genera voces con un alto grado de naturalidad para su tamaño, equilibrando la calidad del audio con la velocidad de procesamiento y los requisitos de almacenamiento. La arquitectura combina un modelo de lenguaje compacto con un códec de audio que logra alta calidad con tasas de bits reducidas mediante el uso de un único libro de códigos. Según la compañía, este equilibrio permite aplicaciones en tiempo real en dispositivos con recursos limitados.
NeuTTS Air está disponible gratuitamente en Hugging Face bajo licencia de código abierto. Las salidas de audio del modelo incluyen marcas de agua para facilitar su identificación. Neuphonic indica que el consumo energético del sistema ha sido optimizado específicamente para dispositivos móviles y embebidos, permitiendo su uso en aplicaciones que van desde asistentes de voz hasta juguetes interactivos y herramientas que requieren cumplimiento estricto de normativas de privacidad.
Empresa de síntesis de voz que genera habla natural para dispositivos mediante inteligencia artificial. Ofrece servicios mediante API cloud y modelos compactos on-device. Incluye capacidades de ...
07/11/2025
Freepik avanza en su estrategia de IA presentando Spaces, una herramienta que integra sus funciones de inteligencia artificial en un entorno de ...
29/10/2025
Google ha actualizado NotebookLM ampliando significativamente su capacidad para procesar colecciones extensas de documentos y añadiendo opciones de ...
26/10/2025
Google ha incorporado una nueva funcionalidad en AI Studio que permite generar aplicaciones con inteligencia artificial mediante descripciones en ...
24/10/2025
Mistral AI presenta AI Studio, una plataforma que ayuda a las empresas a pasar de la experimentación a la operación fiable de sistemas de ...