
Redazione RHC : 2 noviembre 2025 09:01
El 25 de septiembre, Google DeepMind publicó un vídeo que demuestra cómo sus plataformas humanoides gestionan tareas cotidianas de varios pasos utilizando razonamiento multimodal.
En una serie de demostraciones, las máquinas realizaron con seguridad secuencias de acciones, incluyendo la clasificación de objetos según reglas predeterminadas.
La inteligencia de estos sistemas se basa en la familia Gemini Robotics 1.5 . Dos componentes trabajan conjuntamente: el modelo básico traduce señales visuales y mensajes de texto en movimientos específicos, mientras que la versión modificada Gemini Robotics-ER 1.5 crea planes y razona paso a paso sobre la situación actual, eligiendo la secuencia de pasos correcta.
La llamada prueba del plátano demuestra claramente el progreso. Anteriormente, el robot solo tenía que recoger un plátano y colocarlo en un bol: una orden, un resultado.
El sistema clasificó tres frutas diferentes por color y las colocó en platos. Jie Tang, investigador sénior de Google DeepMind, demostró el experimento; el sistema de dos brazos, basado en manipuladores Franka , completó toda la secuencia sin problemas.
La plataforma humanoide Apollo de Apptronik también se probó en una lavandería. La máquina clasificó la ropa por tonalidad en dos contenedores: uno para blancos y otro para negros. Tras el primer intento exitoso, los ingenieros intercambiaron los contenedores para comprobar si el sistema detectaría la confusión y ajustaría su funcionamiento. Apollo reconoció la nueva disposición y completó la clasificación con éxito.
Gemini Robotics 1.5 admite el aprendizaje incorporado: el robot explora su entorno con su cuerpo, sensores y cámaras, y luego actúa en función de sus observaciones . ALOHA 2 se utilizó en la mayoría de las escenas, pero los mismos escenarios también se pueden abordar con Apollo y el sistema Franka de dos brazos.
También se han añadido funciones basadas en agentes . Por ejemplo, el sistema puede encargarse de la clasificación de residuos: buscará en internet las normativas locales, evaluará visualmente cada artículo, lo asignará a compostaje, reciclaje o basura, y realizará todo el proceso, desde la decisión hasta la eliminación en el contenedor adecuado.
Este nivel de consistencia se logra mediante la colaboración de dos componentes: uno responsable del proceso desde la percepción hasta el movimiento , y otro de la planificación y la lógica. Esta arquitectura hace que la ejecución de tareas en el mundo real sea más intuitiva y fiable.
Se ha prestado especial atención a la seguridad. Los robots están entrenados para evaluar riesgos de forma proactiva, respetar las limitaciones humanas y evitar situaciones peligrosas . Con el apoyo de equipos especializados y la plataforma de pruebas ASIMOV actualizada , Gemini Robotics-ER 1.5 ha alcanzado una posición de liderazgo en las pruebas, lo que debería facilitar la implementación precisa de sistemas similares fuera del laboratorio.
Redazione
Los usuarios que buscan optimizar al máximo el espacio en Windows han batido un nuevo récord. El entusiasta @XenoPanther ha logrado reducir el tamaño de una copia en ejecución de Windows 7 a tan s...

El informe financiero de Microsoft indica que OpenAI podría haber perdido 12.000 millones de dólares en su último trimestre fiscal. Un gasto en el informe de ganancias de Microsoft (517,81, -7,95, ...

A partir del martes 12 de noviembre de 2025, entrarán en vigor nuevas disposiciones de la Autoridad Reguladora de las Comunicaciones Italiana (AGCOM), que exigirán un sistema de verificación de eda...

AzureHound, que forma parte de la suite BloodHound , nació como una herramienta de código abierto para ayudar a los equipos de seguridad y a los equipos rojos a identificar vulnerabilidades y rutas ...

La puntualidad es clave en ciberseguridad. Red Hot Cyber lanzó recientemente un servicio completamente gratuito que permite a los profesionales de TI, analistas de seguridad y entusiastas monitorear ...