Dans une nouvelle qui a secoué le monde de la technologie, GoogleDeepMind, GoogleResearch et d'autres experts de Google ont présenté Gemini, une nouvelle génération de modèles d'intelligence artificielle multimodale. Ces modèles, conçus pour traiter les images, l'audio, la vidéo et le texte, ont déjà donné des résultats impressionnants.
Le plus performant d'entre eux est Gemini Ultra, qui a établi de nouveaux records dans 30 des 32 catégories de tests. Il a été le plus performant dans les tâches de texte et de raisonnement, ainsi que dans la compréhension d'images et de vidéos et la reconnaissance vocale. Gemini Ultra a démontré sa puissance en atteignant le niveau expert du MMLU dans 57 domaines, avec des scores supérieurs à 90 %. Ce modèle a également établi un nouveau record en MMMU avec 62,4 %, dépassant les modèles précédents de plus de 5 %.
Gemini n'est pas seulement une réussite technologique, c'est aussi un outil polyvalent qui couvre des domaines allant de l'éducation à diverses applications. Le modèle est capable de reconnaître une écriture illisible, de convertir des tâches en équations mathématiques, de détecter des erreurs et de proposer des solutions optimales. Gemini a déjà été intégré dans plusieurs produits Google, dont Google Bard, et sera prochainement disponible via des API sur Google AI Studio et Google Cloud Vertex AI.
Il est également important de noter que selon les tests de Google, Gemini surpasse même ChatGPT 4 d'OpenAI. Cette avancée ouvre de nouvelles perspectives pour le développement de l'intelligence artificielle, la rendant plus accessible et plus efficace dans diverses industries. Nous sommes impatients de voir comment cette innovation changera notre façon de concevoir les capacités de l'IA !