У новині, яка сколихнула світ технологій, команда GoogleDeepMind, GoogleResearch та інші експерти Google представили Gemini - нове покоління мультимодальних моделей штучного інтелекту. Ці моделі, спроектовані для обробки зображень, аудіо, відео та тексту, вже показали вражаючі результати.
Найвищий стандарт серед них - Gemini Ultra, яка встановила нові рекорди в 30 з 32 тестових категорій. В її активі першість у текстових і розважливих завданнях, а також у розумінні зображень, відео та розпізнаванні мови. Gemini Ultra проявила свою міць, досягнувши рівня експертів по MMLU в 57 областях, демонструючи результати вище 90%. Ця модель також встановила новий рекорд у MMMU - 62.4%, перевершуючи попередні моделі на більш ніж 5%.
Gemini - це не просто технологічне досягнення, а й універсальний інструмент, що охоплює сфери від освіти до різних областей застосування. Модель здатна розпізнавати нерозбірливий почерк, перетворювати завдання на математичні рівняння, виявляти помилки та пропонувати оптимальні рішення. Gemini вже інтегрована в кілька продуктів Google, включно з Bard від Google, і в найближчому майбутньому буде доступна через API на Google AI Studio і Google Cloud Vertex AI.
Не менш важливо відзначити, що за результатами тестів Google Gemini випереджає навіть ChatGPT 4 від OpenAI. Цей крок уперед відкриває нові перспективи для розвитку штучного інтелекту, роблячи його доступнішим і ефективнішим у різних галузях. Чекаємо з нетерпінням, як ця інновація змінить наше уявлення про можливості AI!