- PVSM.RU - https://www.pvsm.ru -

Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Всем привет!
Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.

У себя в телеграм-канале [1] делюсь сжатыми и структурированными саммери статей.

Сегодняшний перевод — Google Is Winning on Every AI Front [2]

Google вернулся в гонку ИИ с триумфом: их Gemini 2.5 Pro возглавил все авторитетные рейтинги моделей и получил восторженные отзывы экспертов. Компания интегрирует лучший в мире ИИ в свои сервисы с миллиардной аудиторией, создавая преимущество, которое нельзя купить за деньги — экосистему, где искусственный интеллект становится неотъемлемой частью повседневных инструментов.

Google создал не только лучшую модель, но и собственную цепочку поставок для ИИ-инфраструктуры: от TPU Ironwood до облачных сервисов. Эта вертикальная интеграция — тот же подход, который сделал Apple неуязвимой на рынке смартфонов (аппаратные спецификации TPU).


Источник

Artificial Analysis Intelligence Index
Источник

Скорость. Выдача токенов в секунду
Источник

Стоимость токенов
  • Затем есть Gemma 3 [41] — модель Google с открытым исходным кодом, конкурентоспособная с лучшими моделями с открытым исходным кодом [42], включая Llama 4 (слишком большую [43]) и DeepSeek-V3.

  • Swyx построил график [44], показывающий, что "Google владеет Парето-фронтиром" с Gemini 2.0/2.5 (как Pro, так и Flash) по двум наиболее важным показателям: производительность и стоимость. Более того, наиболее производительные модели Google остаются экономически эффективными, а наиболее экономичные модели остаются производительными. Google на данный момент просто издевается над конкуренцией; Gemini буквально вне графиков.

Источник

График ценообразования модели. Полный анализ на https://latent.space
  • LLM, лежащие в основе чатботов, таких как Gemini и ChatGPT, является главным преимуществом, но далеко не единственным. Google доминирует в других областях генеративного AI так же явно, как и в моделях на основе текста. Они объявили, что интегрируют другие AI-инструменты, которые у них есть, в Vertex AI [45]: Lyria [46] (музыка), Imagen 3 [47] (изображения), Veo 2 [48] (видео), и Chirp 3 [49] (голос/речь). Это, в некотором роде, побочные проекты для Google. Тем не менее, они мирового класса в своих категориях. Возможно, генерация изображений ChatGPT [50] лучше, но, например, Veo 2 заставил меня написать статью под названием "Вы должны увидеть, как далеко продвинулось AI-видео [51]", в то время как OpenAI Sora - это чистая ерунда [52].

  • А что насчет агентов? Gemini 2.5 Pro в режиме Deep Research [53] в два раза лучше [54], чем Deep Research от OpenAI (до сих пор широко считавшийся самым важным AI-продуктом для исследовательской работы). Google DeepMind продолжает развивать Project Astra [55] (ассистент) и Project Mariner [56] (взаимодействие с компьютером).

Источник

Источник

Недавно писал Почему A2A может вытеснить MCP в мире AI-агентов? [60]

Источник

MCP — отличный протокол, который стремительно превращается в открытый стандарт эпохи агентных ИИ. Мы рады сообщить, что добавим его поддержку в наши модели Gemini и SDK. С нетерпением ждём возможности развивать MCP вместе с его командой и другими участниками отрасли.
  • Вдобавок ко всему, они продолжают выпускать высококачественные статьи для публикации в Nature [61] или представления на ICLR [62] или NeurIPS [63] или в других мировых журналах или конференциях. И если вдруг этого не происходит, вы в любом случае можете сказать, что они серьезно относятся как к усилиям по AGI [64], так и к промышленному AI [65].

Это всё? Не совсем. Давайте не будем забывать, что Google — компания по производству потребительского программного обеспечения в той же степени, что и AI-компания. Они создают лучшие модели, чем OpenAI и Anthropic, но они также делают много других вещей, которые никто другой делать не может.

  • OpenAI пытается войти [66] на рынки, где Google уже король. Возьмем поиск (одну из самых важных категорий программного обеспечения). Google и YouTube (№1 и №2 по общему поисковому трафику, оба под зонтиком Alphabet) получают комбинированную долю 50% от общего трафика в мире [67] (на рабочих столах). ChatGPT находится (похвально, хотя) на 6-м месте с 2,33%. Разве "ChatGPT не убил Google" 2 года назад? Сэм Альтман знает [68], что он пытается победить окончательного босса. (Кроме того, если у кого-то и есть массив данных, то это Google: YouTube, Search, Books, Photos и т.д.).

Источник

Источник
  • Но поиск — это лишь один из семи продуктов Google [69] с не менее чем двумя миллиардами активных пользователей в месяц (Search, YouTube, Android, Maps, Chrome, Gmail и Play Store). Я хвалю OpenAI за то, что они довели ChatGPT до 500 миллионов активных пользователей в неделю [70] (опять же, похвально), но они играют в разных лигах. Что происходит, когда Google добавляет Gemini к [71] своему [72] всему [73] набору [74] продуктов [75]? Внезапно миллиарды людей получают доступ по умолчанию к лучшему AI в мире бесплатно. И это не говоря уже о также чрезвычайно популярных облачных сервисах Workspace (Drive, Gmail, Docs, Sheets…).

  • Говоря об облачных вычислениях. Google, помимо того, что является AI-компанией и программной компанией, является гиперскейлером: Google Cloud арендует чипы [76] таким компаниям, как Anthropic, и сотрудничает с [77] компаниями, такими как Nvidia. OpenAI, между тем, зависит от Microsoft Azure [78], а Anthropic также зависит от Amazon AWS [79]. В то время как они оба щекочут ноги Google своими релизами AI, Google правой рукой борется с настоящими гигантами — Microsoft и Amazon — в облачном пространстве.

Инфографика: Amazon и Microsoft лидируют на глобальном облачном рынке | Statista

Инфографика: Amazon и Microsoft лидируют на глобальном облачном рынке | Statista
  • А левая рука? Подождите: AI, программное обеспечение, облако... Я что-то забываю. О, конечно, Google также является аппаратной компанией. Левой рукой Google борется с Nvidia на рынке AI-чипов (как для устранения своей бывшей зависимости от GPU, так и для продажи своих чипов другим компаниям [80]). Насколько хорошо у них дела? Они только что анонсировали 7-ю версию своего TPU, Ironwood [81]. Характеристики впечатляют [82]. Это чип, созданный для эпохи AI-инференса, как и Nvidia Blackwell. Но Nvidia занята борьбой с маленькими стартапами [83], которые стремятся захватить долю рынка на стороне инференса для AI-рабочих нагрузок, в то время как доходы Google защищены в других местах. А OpenAI... ну [84].

Источник

Источник

Я наверняка что-то упускаю, но думаю, что это достаточно побед для Google.

Когда я складываю картину Google + DeepMind вместе, я могу только удивляться, почему люди, включая меня, когда-либо стали такими оптимистичными относительно OpenAI или Anthropic или даже Meta.

Автор: Kual

Источник [94]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/google/417150

Ссылки в тексте:

[1] телеграм-канале: https://t.me/+9rn-oYnaOAUzNDIy

[2] Google Is Winning on Every AI Front: https://www.thealgorithmicbridge.com/p/google-is-winning-on-every-ai-front?r=1kday&triedRedirect=true

[3] Gemini 2.5 Pro Experimental: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking

[4] LMArena: https://lmarena.ai/?leaderboard

[5] GPQA Diamond: https://x.com/EpochAIResearch/status/1907519991252992508

[6] Humanity's Last Exam: https://scale.com/leaderboard/humanitys_last_exam

[7] Aider Polyglot: https://aider.chat/docs/leaderboards/

[8] Live Bench: https://livebench.ai/#/

[9] игре в Pokemon: https://m.twitch.tv/gemini_plays_pokemon

[10] Minecraft Bench: https://mcbench.ai/leaderboard

[11] примеры: https://x.com/wintermoat/status/1909787050640920894

[12] креативном письме: https://x.com/emollick/status/1904656593083396541

[13] понимании длинного контекста: https://fiction.live/stories/Fiction-liveBench-Mar-25-2025/oQdzQvKHw8JyXbN87

[14] люди: https://x.com/MatthewBerman/status/1904714953095078004

[15] массово: https://www.reddit.com/r/Bard/s/TTXsRTWJdA

[16] сообщают: https://x.com/emollick/status/1910208856480768283

[17] о том: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#intelligence

[18] что: https://x.com/cgarciae88/status/1907457306947702925

[19] Gemini: https://www.reddit.com/r/ClaudeAI/s/30nIFOtVMP

[20] 2.5: https://www.reddit.com/r/GeminiAI/s/ihTsYvDxIY

[21] Pro: https://www.reddit.com/r/ClaudeAI/s/khkte9Bq49

[22] действительно: https://x.com/xf1280/status/1904587791868322036

[23] является: https://x.com/emollick/status/1909748270249001248

[24] лучшей: https://x.com/daniel_mac8/status/1910058485150269797

[25] моделью: https://x.com/petergyang/status/1906007718961492391

[26] на сегодняшний день: https://www.reddit.com/r/ChatGPTCoding/s/O3qJuHRsWA

[27] моделью: https://www.reddit.com/r/GeminiAI/s/aLDvqH12oq

[28] клип Matthew Berman: https://x.com/MatthewBerman/status/1904715099862098109

[29] быстрый: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#speed

[30] дешевый: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#pricing

[31] предоставляют бесплатный доступ: https://x.com/sundarpichai/status/1908173216499093625

[32] контекстное окно в 1 миллион токенов: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#context-window

[33] скоро запускается: https://techcrunch.com/2025/04/09/googles-newest-gemini-ai-model-focuses-on-efficiency/

[34] 2.0: https://deepmind.google/technologies/gemini/flash/

[35] Lite: https://deepmind.google/technologies/gemini/flash-lite/

[36] Thinking: https://deepmind.google/technologies/gemini/flash-thinking/

[37] чрезвычайно быстрым: https://artificialanalysis.ai/models/gemini-2-0-flash#speed

[38] чрезвычайно дешевым: https://x.com/deedydas/status/1883355957838897409

[39] даже DeepSeek's: https://artificialanalysis.ai/models/gemini-2-0-flash?models=gemini-2-0-flash%2Cdeepseek-r1%2Cdeepseek-v3&endpoints=#pricing

[40] своей дешевизной: https://x.com/EMostaque/status/1881310721746804810

[41] Gemma 3: https://blog.google/technology/developers/gemma-3/

[42] конкурентоспособная с лучшими моделями с открытым исходным кодом: https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

[43] слишком большую: https://x.com/jeremyphoward/status/1908607345393098878

[44] Swyx построил график: https://x.com/swyx/status/1908215411214344669

[45] Vertex AI: https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai

[46] Lyria: https://deepmind.google/discover/blog/transforming-the-future-of-music-creation/

[47] Imagen 3: https://deepmind.google/technologies/imagen-3/

[48] Veo 2: https://deepmind.google/technologies/veo/veo-2/

[49] Chirp 3: https://cloud.google.com/text-to-speech/docs/chirp3-hd

[50] генерация изображений ChatGPT: https://openai.com/index/introducing-4o-image-generation/

[51] Вы должны увидеть, как далеко продвинулось AI-видео: https://www.thealgorithmicbridge.com/p/you-must-see-how-far-ai-video-has

[52] OpenAI Sora - это чистая ерунда: https://www.thealgorithmicbridge.com/p/openai-sora-turbo-a-very-expensive

[53] Deep Research: https://x.com/demishassabis/status/1910143772635078754

[54] в два раза лучше: https://x.com/AdvaitOnline/status/1909721368259960957

[55] Project Astra: https://deepmind.google/technologies/project-astra/

[56] Project Mariner: https://deepmind.google/technologies/project-mariner/

[57] Agent2Agent: https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

[58] Model Context Protocol: https://www.anthropic.com/news/model-context-protocol

[59] также будут строить: https://x.com/demishassabis/status/1910107859041271977

[60] Почему A2A может вытеснить MCP в мире AI-агентов?: https://habr.com/ru/articles/900498/

[61] публикации в Nature: https://www.nature.com/nature-index/institution-outputs/United%20Kingdom%20%28UK%29/Google%20DeepMind/54ee76b8140ba0f7058b4567

[62] ICLR: https://deepmind.google/discover/blog/google-deepmind-at-iclr-2024/

[63] NeurIPS: https://deepmind.google/discover/blog/google-deepmind-at-neurips-2024/

[64] усилиям по AGI: https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/

[65] промышленному AI: https://www.kaggle.com/whitepaper-prompt-engineering

[66] пытается войти: https://openai.com/index/introducing-chatgpt-search/

[67] долю 50% от общего трафика в мире: https://x.com/Similarweb/status/1888599585582370832

[68] Сэм Альтман знает: https://x.com/sama/status/1888703820596977684

[69] один из семи продуктов Google: https://www.washingtonpost.com/technology/2024/05/03/google-antitrust-monopoly-company-ownership-youtube/

[70] 500 миллионов активных пользователей в неделю: https://www.theinformation.com/articles/chatgpt-revenue-surges-30-just-three-months

[71] к: https://x.com/sundarpichai/status/1909456762723615052

[72] своему: https://blog.google/products/maps/gemini-google-maps-navigation-updates/

[73] всему: https://blog.google/products/android/android-gemini-google-ai/

[74] набору: https://support.google.com/mail/answer/14199860

[75] продуктов: https://chromewebstore.google.com/detail/gemini-for-chrome/aajjgdpofhhcjmjoombjdfepplndhgcp

[76] арендует чипы: https://www.anthropic.com/news/anthropic-partners-with-google-cloud

[77] сотрудничает с: https://x.com/googlecloud/status/1910006285069668495

[78] зависит от Microsoft Azure: https://blogs.microsoft.com/blog/2025/01/21/microsoft-and-openai-evolve-partnership-to-drive-the-next-phase-of-ai/

[79] зависит от Amazon AWS: https://www.anthropic.com/news/anthropic-amazon-trainium

[80] продажи своих чипов другим компаниям: https://techcrunch.com/2025/04/09/ilya-sutskever-taps-google-cloud-to-power-his-ai-startups-research/

[81] Ironwood: https://x.com/OfficialLoganK/status/1909992382046814458

[82] впечатляют: https://x.com/omarsar0/status/1909995966297469226

[83] борьбой с маленькими стартапами: https://www.theregister.com/2025/03/12/training_inference_shift/

[84] ну: https://www.reuters.com/technology/openai-set-finalize-first-custom-chip-design-this-year-2025-02-10/

[85] сражается: https://gs.statcounter.com/vendor-market-share/mobile

[86] Gemini уже на Pixel 9: https://arstechnica.com/gadgets/2024/08/pixel-9-phones-the-gemini-ai-stuff-reviewed/

[87] поделиться с ним экраном: https://www.theverge.com/news/644757/google-gemini-live-screen-share-video-camera-pixel-9

[88] попросить его взять на себя управление вашей камерой: https://blog.google/products/gemini/gemini-live-android-tips/

[89] является ли AI вапорвейром или нет: https://www.theverge.com/news/629940/apple-siri-robby-walker-delayed-ai-features

[90] выясняет: https://www.theinformation.com/articles/openai-discussed-buying-jony-ive-sam-altmans-ai-device-startup

[91] Другие: https://www.theverge.com/news/614883/humane-ai-hp-acquisition-pin-shutdown

[92] пытались: https://www.youtube.com/watch?v=ddTV12hErTc&ab_channel=MarquesBrownlee

[93] безуспешно: https://techcrunch.com/2025/01/20/friend-delays-shipments-of-its-ai-companion-pendant/

[94] Источник: https://habr.com/ru/articles/901720/?utm_campaign=901720&utm_source=habrahabr&utm_medium=rss