Гугл запускает свою мультимодальную GPT - Google Gemini, революционный прорыв в мире AI

В новости, которая сотрясла мир технологий, команда GoogleDeepMind, GoogleResearch и другие эксперты Google представили Gemini - новое поколение мультимодальных моделей искусственного интеллекта. Эти модели, спроектированные для обработки изображений, аудио, видео и текста, уже показали впечатляющие результаты.

Наивысший стандарт среди них - Gemini Ultra, установивший новые рекорды в 30 из 32 тестовых категорий. В ее активе первенство в текстовых и рассудительных задачах, а также в понимании изображений, видео и распознавании речи. Gemini Ultra проявила свою мощь, достигнув уровня экспертов по MMLU в 57 областях, демонстрируя результаты выше 90%. Эта модель также установила новый рекорд в MMMU - 62.4%, превосходя предыдущие модели на более чем 5%.

Gemini - это не просто технологическое достижение, но и универсальный инструмент, охватывающий сферы от образования до различных областей применения. Модель способна распознавать неразборчивый почерк, превращать задачи в математические уравнения, выявлять ошибки и предлагать оптимальные решения. Gemini уже интегрирована в несколько продуктов Google, включая Bard от Google, и в ближайшем будущем будет доступна через API на Google AI Studio и Google Cloud Vertex AI.

Не менее важно отметить, что по результатам тестов Google Gemini опережает даже ChatGPT 4 от OpenAI. Этот шаг вперед открывает новые перспективы для развития искусственного интеллекта, делая его более доступным и эффективным в различных областях. Ждем с нетерпением, как эта инновация изменит наше представление о возможностях AI!

Если вы обнаружили ошибку или неточность в тексте, выделите ее и нажмите Ctrl + Enter
Написать на Email Написать на Telegram Написать на Whatsapp Написать на Skype