MAI-Image-1 es el primer modelo de generación de imágenes desarrollado internamente por Microsoft. El gigante del software lo incluirá en el futuro en soluciones como Bing y Copilot y en competencia con el gpt-image-1 de OpenAI y los modelos Gemini de Google.
Microsoft ha dependido en gran medida de los modelos de IA de OpenAI desde que iniciara su ambicioso programa de inteligencia artificial. Salvo la familia Phi de pequeños modelos de lenguaje, Microsoft no ha desarrollado ningún modelo importante por su cuenta. Pero el pasado agosto sorprendió al mercado con sus dos primeros modelos propios de IA generativa, el modelo de generación de voz natural, MAI-Voice-1, y el primer modelo de texto, el MAI-1-preview.
Ahí quedó claro que el ‘romance’ con OpenAI había llegado a su fin. Y es que el gran nombre en inteligencia artificial no ha querido ceder su control a Microsoft como ésta deseaba y todo apunta que la pretendida alianza cuasi exclusiva tiene fecha de caducidad y Microsoft siendo un cliente más entre las decenas que usan las tecnologías de OpenAI.
MAI-Image-1, avanzando con tecnología propia
Microsoft ha destacado que el nuevo modelo de generación de imágenes por IA es significativamente más rápido en comparación con otros modelos grandes del mercado. La compañía cree que los usuarios podrán generar las imágenes deseadas con mayor rapidez.
El equipo de desarrollo dice haberse centrado en evitar que el modelo produjera resultados repetitivos o excesivamente estilizados. Microsoft dice haberlo logrado priorizando una selección rigurosa de datos y una evaluación matizada y centrada en las tareas. La compañía también afirma que MAI-Image-1 ofrece un mejor rendimiento en la generación de imágenes fotorrealistas y puede generar iluminación natural y paisajes.
Probado en LMArena, una plataforma abierta y comunitaria creada para la evaluación comparativa de modelos de inteligencia artificial, MAI-Image-1 ha debutado en el puesto número 9. Puede parecer algo no extraordinario, pero representa un avance sólido para un modelo de primera generación y desarrollado por completo internamente.
El responsable de Microsoft AI, Mustafa Suleyman, ha prometido que continuarán perfeccionando el modelo para ascender a una clasificación que tiene por delante a desarrollos de ByteDance, OpenAI, Google o Tencent. El resultado práctico de este modelo, cuando creativos y entusiastas podamos usar estas tecnologías, se concretará en su integración «muy pronto» en el asistente Copilot y en el creador de imágenes de Bing.
Veremos. La carrera por la IA acaba de empezar y todos van a mejorar. Más allá de su nivel tecnológico, el MAI-Image-1 es importante por lo comentado: Microsoft y OpenAI tienen estrategias diferentes y van a seguir su propio camino aunque sigan colaborando.
La entrada Microsoft presenta su primer generador de imágenes propio, el MAI-Image-1 se publicó primero en MuyComputer.