Representando un hito en el desarrollo del ecosistema inteligente de Xiaomi y de la comunidad de investigación de IA más amplia, Xiaomi lanzó oficialmente y con código abierto completo su modelo encarnado a gran escala MiMo-Embodied. Con el aumento de la inteligencia encarnada en el hogar y una mayor aceptación de la conducción autónoma, Xiaomi pretende ahora superar un antiguo reto: desarrollar la interoperabilidad cognitiva y de capacidades entre los robots de interior y los vehículos de exterior. Con MiMo-Embodied, Xiaomi introduce un modelo de base unificado que hace avanzar la conducción autónoma, la inteligencia incorporada y las capacidades generales de IA en un único marco.
¿Qué hace que MiMo-Embodied sea un gran avance?
Según Xiaomi, MiMo-Embodied es el primero del sector en cuanto a un modelo de base incorporada para salvar las distancias entre la conducción autónoma y la inteligencia incorporada. Este modelo une la interpretación de tareas, la percepción y la toma de decisiones tanto en escenarios domésticos como de movilidad, estableciendo una base científica sólida para los futuros sistemas de IA en todos los dominios. Este paso supone una ampliación de las ambiciones de Xiaomi más allá de la electrónica de consumo, hacia la robótica más avanzada y la automatización a gran escala.
Principios técnicos clave del modelo
MiMo-Embodied incorpora un diseño arquitectónico profundo para apoyar la cognición multiescenario. El modelo se centra en la armonización de las tareas incorporadas, que incluyen el razonamiento espacial y la planificación de tareas, con tareas de conducción como la percepción y la generación de trayectorias. Este enfoque de procesamiento unificado permite a Xiaomi pasar de la inteligencia vertical especializada a la colaboración inteligente escalable entre dominios.
Tres características clave de la tecnología
Amplia Cobertura de Capacidades Transversales
El modelo soporta conjuntamente tres tareas cruciales en el ámbito de la inteligencia incorporada, el razonamiento de asequibilidad, la planificación de tareas y la comprensión espacial, con tres tareas centrales de la conducción autónoma: la percepción del entorno, la predicción del estado y la planificación de la conducción. Estas capacidades juntas forman un escenario de inteligencia completo que abarca los entornos domésticos, la robótica de interiores y el tráfico del mundo real.
Inteligencia Colaborativa Bidireccional
Xiaomi destaca que MiMo-Embodied permite la transferencia de conocimientos entre la robótica de interiores y la conducción autónoma. Durante las pruebas del sistema, demostraron que la mejora de la capacidad de toma de decisiones en la robótica doméstica puede mejorar el rendimiento de la conducción en carretera y viceversa. La mejora bidireccional crea un nuevo marco para los sistemas inteligentes integrados.
Optimización de la cadena completa para implantaciones en el mundo real
Para garantizar que el despliegue sea fiable, Xiaomi ha diseñado un proceso de entrenamiento en varias fases que incluye el aprendizaje de capacidades, la mejora de la inferencia de la cadena de pensamiento (CoT) y el ajuste del aprendizaje por refuerzo (RL). Este enfoque refuerza la solidez del entorno real, haciendo que el modelo sea adecuado para escenarios complejos y dinámicos.
Rendimiento en 29 puntos de referencia
Xiaomi afirma que MiMo-Embodied superó a los principales modelos de código abierto, de código cerrado y patentados en **29 puntos de referencia críticos.
Resultados de Embodied Intelligence
Consiguió un rendimiento puntero en 17 pruebas de referencia, demostrando habilidades excepcionales en la planificación de tareas, la comprensión espacial y la predicción de asequibilidad.
Resultados de la Conducción Autónoma
Consiguió resultados de vanguardia en 12 pruebas de referencia, desde la percepción a la predicción del estado y la planificación de la conducción, estableciendo un nuevo listón para la inteligencia de conducción multietapa.
Comprensión general del lenguaje visual
MiMo-Embodied también demostró una generalización avanzada en tareas de lenguaje visual, confirmando su versatilidad en dominios de IA más amplios.
Xiaomi abre completamente el modelo a desarrolladores e investigadores
Xiaomi ha abierto el modelo y la base de código de MiMo-Embodied, reforzando el compromiso de la empresa con la investigación transparente y colaborativa. Los desarrolladores pueden explorar, adaptar y construir sobre el modelo a través de los repositorios oficiales. Con la apertura de MiMo-Embodied, Xiaomi quiere acelerar la innovación en el ámbito de la robótica inteligente, la movilidad inteligente y los ecosistemas conectados.

Emir Bardakçı
