
Redazione RHC : 25 octubre 2025 09:23
El 25 de septiembre de 2025, Google DeepMind lanzó Gemini Robotics-ER 1.5, un modelo diseñado para su uso en robótica. Esta es la primera versión del sistema de razonamiento disponible públicamente para desarrolladores .
El modelo funciona como un » cerebro de alto nivel» para el robot : entiende comandos en lenguaje natural, planifica acciones de varios pasos y organiza cadenas de comportamiento complejas .
Combina la percepción visoespacial , la evaluación del progreso y la capacidad de acceder a herramientas de terceros, como Google Search, Robot API o modelos VLA (visión-lenguaje-acción).
Puedes empezar a trabajar con el sistema de inmediato a través de Google AI Studio y la API de Gemini . También se ha publicado en el blog un informe técnico con resultados detallados de las pruebas.
Una de las innovaciones clave es la capacidad de realizar razonamiento espacial rápido y preciso con baja latencia. Gemini Robotics-ER 1.5 puede determinar las coordenadas de objetos basándose en su tamaño, peso y propiedades, y utilizar estos datos para una manipulación precisa.
El modelo puede reconocer tareas complejas como » ordenar un escritorio usando el ejemplo de la foto» o » clasificar residuos según la normativa local», a la vez que consulta fuentes en línea para obtener información adicional. Para ejecutar estos escenarios, se utilizan la planificación espacio-temporal y la verificación del éxito.
Los desarrolladores destacan una función llamada » presupuesto de pensamiento » que les permite gestionar el equilibrio entre la velocidad de respuesta y la precisión del razonamiento. Para operaciones sencillas, pueden obtener una respuesta rápida, mientras que para problemas de varios pasos, el modelo tardará más en «pensar».
Se ha prestado gran atención a la seguridad. Gemini Robotics-ER 1.5 reconoce mejor las actividades que violan los límites físicos del robot, como exceder su capacidad de carga útil. También se han integrado filtros para evitar la generación de planes peligrosos o maliciosos . La evaluación se realizó, entre otras cosas, utilizando el benchmark ASIMOV .
Los desarrolladores enfatizan que las características de seguridad integradas deben complementarse con métodos de ingeniería tradicionales: sistemas de parada de emergencia, prevención de colisiones y análisis de riesgos.
En la práctica, el modelo demuestra comprensión de las secuencias de acción. Experimentalmente, describió el funcionamiento de dos brazos robóticos que transfieren objetos a contenedores con una sincronización precisa.
En otros ejemplos, Gemini Robotics-ER 1.5 planificó el proceso de preparación del café : determinó dónde colocar la taza y la cápsula y trazó la trayectoria para cerrar la tapa de la máquina de café.
Los desarrolladores pueden controlar la profundidad del razonamiento a través de parámetros API, usar cuadernos Colab listos para usar y conectar el SDK de Python para integrarlo en sus propios proyectos.
Gemini Robotics-ER 1.5 se posiciona como un componente fundamental para la creación de futuros sistemas robóticos en los que la inteligencia artificial combinará percepción, planificación y acción física.
Redazione
En los últimos días, algunos usuarios han recibido una notificación diciendo que sus dispositivos Gemini Advanced han sido «actualizados del modelo de la generación anterior al 3.0 Pro, el modelo...

La Agencia de Seguridad de Infraestructura y Ciberseguridad de Estados Unidos (CISA) ha emitido una alerta global con respecto a la explotación activa de una falla crítica de ejecución remota de c�...

El lunes 20 de octubre, el Canal 4 transmitió un documental completo presentado por un presentador de televisión creativo impulsado completamente por inteligencia artificial. » No soy real. Por pri...

El ecosistema ruso del cibercrimen ha entrado en una fase de profunda transformación, provocada por una combinación de factores: una presión internacional sin precedentes por parte de los organismo...

Investigadores de seguridad han descubierto vulnerabilidades en un sitio web de la FIA que contenía información personal confidencial y documentos relacionados con los pilotos, incluido el campeón ...