H Company lanza Surfer 2, un agente diseñado para ejecutar tareas en entornos de escritorio, web y móvil. El sistema alcanza los mejores resultados registrados en cuatro pruebas de referencia que evalúan capacidades de control y navegación en plataformas digitales.
La compañía H Company ha anunciado Surfer 2, un agente de 'computer-use' (uso de ordenadores) capaz de operar en múltiples plataformas digitales mediante interacción visual y táctil. El sistema logra resultados récord en cuatro pruebas de referencia que evalúan la capacidad de agentes de inteligencia artificial para controlar ordenadores, navegar por la web y gestionar dispositivos móviles.
La arquitectura de Surfer 2 separa planificación estratégica de ejecución táctica mediante un módulo orquestador configurable que descompone tareas complejas en subtareas asignadas a subagentes especializados. Cada subagente reporta resultados al orquestador, que determina el siguiente paso o replantea la estrategia en caso de fallo. El sistema puede operar con o sin este módulo según la complejidad de la tarea, e incluye componentes dedicados a percepción visual, validación de tareas y recuperación ante fallos para garantizar consistencia en diferentes entornos.
En OSWorld, una prueba que mide la capacidad para controlar un entorno de escritorio Ubuntu, Surfer 2 alcanza un 60,1% de éxito en el primer intento dentro de la categoría que permite únicamente percepción visual e interacción. Con diez intentos, el sistema llega al 77%, superando la línea base humana del 72,4%. En WebArena, que evalúa agentes en entornos web simulados que incluyen comercio electrónico, foros sociales y plataformas de gestión de contenidos, obtiene un 69,6% de éxito.
En WebVoyager, una prueba de recuperación de información en sitios web activos, Surfer 2 logra un 97,1% de acierto, mejorando el anterior registro del 93,9%. En AndroidWorld, que mide la capacidad para controlar dispositivos Android y usar 20 aplicaciones reales, alcanza un 87,1% de éxito mediante visión e interacción táctil, superando también la línea base humana del 80%.
H Company señala que los resultados de Surfer 2 provienen de la combinación de modelos de fundación externos con sus propios métodos de entrenamiento e infraestructura de agentes. La compañía indica que las ejecuciones de Surfer 2 tienen costes elevados y trabaja ahora en Holo2, su siguiente modelo propietario diseñado para ofrecer rendimiento similar con costes reducidos. Próximamente publicará un informe técnico completo sobre el rendimiento y las evaluaciones de Surfer 2.
Plataforma de desarrollo de agentes de inteligencia artificial que automatiza tareas web complejas. Ofrece Runner H, un agente web capaz de comprender instrucciones en lenguaje natural, adaptarse ...
07/11/2025
Freepik avanza en su estrategia de IA presentando Spaces, una herramienta que integra sus funciones de inteligencia artificial en un entorno de ...
29/10/2025
Google ha actualizado NotebookLM ampliando significativamente su capacidad para procesar colecciones extensas de documentos y añadiendo opciones de ...
26/10/2025
Google ha incorporado una nueva funcionalidad en AI Studio que permite generar aplicaciones con inteligencia artificial mediante descripciones en ...
24/10/2025
Mistral AI presenta AI Studio, una plataforma que ayuda a las empresas a pasar de la experimentación a la operación fiable de sistemas de ...