Google представила Gemini 3 Deep Think: ИИ для научных исследований
Баку, 13 февраля, АЗЕРТАДЖ
Компания Google представила обновленную версию своей системы искусственного интеллекта Gemini 3 Deep Think, предназначенную для решения сложных задач в области науки и инженерии.
Как сообщает АЗЕРТАДЖ со ссылкой на Google Blog, новая версия была разработана при участии ученых. Платформа ориентирована на исследовательские задачи, где нет единственного правильного ответа, а данные могут быть неполными или противоречивыми.
Режим Deep Think доступен в приложении Gemini, однако воспользоваться им могут только подписчики Google AI Ultra. Кроме того, впервые доступ к системе будет открыт через API Gemini — для этого инженерам, исследователям и компаниям необходимо подать заявку.
По данным компании, Gemini 3 Deep Think продемонстрировал высокие результаты в ряде тестов. В испытании Humanity’s Last Exam система набрала 48,4 % без использования сторонних инструментов. В бенчмарке ARC-AGI-2 показатель составил 84,6 %.
В тесте по программированию Codeforces модель получила рейтинг Эло 3455. В задачах Международной математической олимпиады 2025 года система показала уровень золотой медали. Аналогичный результат был достигнут в олимпиадах по химии и физике. В тесте CMT-Benchmark по теоретической физике результат составил 50,5 %.
На базе Gemini 3 Deep Think в лаборатории Google DeepMind был создан ИИ-агент под названием Aletheia. Он способен анализировать научные гипотезы, выявлять слабые места в рассуждениях и предлагать уточненные решения. Важной особенностью является то, что система может признать невозможность дать ответ, если задача выходит за пределы ее возможностей.
Для работы со сложными исследованиями Aletheia использует поисковые инструменты Google и веб-навигацию. При подготовке обзоров научной литературы система старается не ссылаться на несуществующие источники и минимизировать вычислительные ошибки.
Разработчики оценили достижения агента по пяти уровням. В полностью автономном режиме ИИ предложил возможные пути решения трех открытых задач, сформулированных известным математиком Палом Эрдёшем, однако эти результаты были отнесены к категории «незначительной новизны». В ряде случаев система продемонстрировала результаты, пригодные для публикации, однако значительных научных прорывов пока не достигла.
Aletheia проанализировал 700 нерешенных задач Эрдёша и предложил решения для 13 из них. При этом выяснилось, что 9 задач уже имели ранее найденные решения, а действительно новыми могут считаться лишь 4. Из 212 предложенных системой решений «содержательно правильными» были признаны только 6,5 %. Остальные либо содержали серьезные ошибки, либо основывались на неверной интерпретации условий задачи.
Разработчики признали, что система пока склонна упрощать формулировки задач, чтобы легче находить ответы, и остается значительно более подверженной ошибкам по сравнению с человеком.
Таким образом, несмотря на впечатляющие результаты в тестах, искусственный интеллект пока не способен заменить профессиональных ученых и математиков, однако рассматривается как перспективный инструмент для поддержки научных исследований.