
Redazione RHC : 2 noviembre 2025 09:01
El 25 de septiembre, Google DeepMind publicó un vídeo que demuestra cómo sus plataformas humanoides gestionan tareas cotidianas de varios pasos utilizando razonamiento multimodal.
En una serie de demostraciones, las máquinas realizaron con seguridad secuencias de acciones, incluyendo la clasificación de objetos según reglas predeterminadas.
La inteligencia de estos sistemas se basa en la familia Gemini Robotics 1.5 . Dos componentes trabajan conjuntamente: el modelo básico traduce señales visuales y mensajes de texto en movimientos específicos, mientras que la versión modificada Gemini Robotics-ER 1.5 crea planes y razona paso a paso sobre la situación actual, eligiendo la secuencia de pasos correcta.
La llamada prueba del plátano demuestra claramente el progreso. Anteriormente, el robot solo tenía que recoger un plátano y colocarlo en un bol: una orden, un resultado.
El sistema clasificó tres frutas diferentes por color y las colocó en platos. Jie Tang, investigador sénior de Google DeepMind, demostró el experimento; el sistema de dos brazos, basado en manipuladores Franka , completó toda la secuencia sin problemas.
La plataforma humanoide Apollo de Apptronik también se probó en una lavandería. La máquina clasificó la ropa por tonalidad en dos contenedores: uno para blancos y otro para negros. Tras el primer intento exitoso, los ingenieros intercambiaron los contenedores para comprobar si el sistema detectaría la confusión y ajustaría su funcionamiento. Apollo reconoció la nueva disposición y completó la clasificación con éxito.
Gemini Robotics 1.5 admite el aprendizaje incorporado: el robot explora su entorno con su cuerpo, sensores y cámaras, y luego actúa en función de sus observaciones . ALOHA 2 se utilizó en la mayoría de las escenas, pero los mismos escenarios también se pueden abordar con Apollo y el sistema Franka de dos brazos.
También se han añadido funciones basadas en agentes . Por ejemplo, el sistema puede encargarse de la clasificación de residuos: buscará en internet las normativas locales, evaluará visualmente cada artículo, lo asignará a compostaje, reciclaje o basura, y realizará todo el proceso, desde la decisión hasta la eliminación en el contenedor adecuado.
Este nivel de consistencia se logra mediante la colaboración de dos componentes: uno responsable del proceso desde la percepción hasta el movimiento , y otro de la planificación y la lógica. Esta arquitectura hace que la ejecución de tareas en el mundo real sea más intuitiva y fiable.
Se ha prestado especial atención a la seguridad. Los robots están entrenados para evaluar riesgos de forma proactiva, respetar las limitaciones humanas y evitar situaciones peligrosas . Con el apoyo de equipos especializados y la plataforma de pruebas ASIMOV actualizada , Gemini Robotics-ER 1.5 ha alcanzado una posición de liderazgo en las pruebas, lo que debería facilitar la implementación precisa de sistemas similares fuera del laboratorio.
Redazione
La empresa israelí NSO Group apeló un fallo de un tribunal federal de California que le prohíbe utilizar la infraestructura de WhatsApp para distribuir su software de vigilancia Pegasus. El caso, q...

Se ha identificado una vulnerabilidad de omisión de autenticación en Azure Bastion (descubierta por RHC gracias a la monitorización constante de CVE críticos en nuestro portal), el servicio gestio...

El panorama del ransomware está cambiando. Los actores más expuestos —LockBit, Hunters International y Trigona— han pagado el precio de la sobreexposición, incluyendo operaciones internacionale...

Hace exactamente 40 años, el 20 de noviembre de 1985, Microsoft lanzó Windows 1.0 , la primera versión de Windows, que intentó transformar el entonces ordenador personal, una máquina con una lín...

18 de noviembre de 2025 – Tras horas de interrupciones generalizadas , el incidente que afectó a la red global de Cloudflare parece estar cerca de resolverse. La compañía anunció que impleme...