谷歌Gemini 1.5 Pro 夺得lmsys竞技场双冠王！

8 月 30, 2024 #Gemini, #中文, #双冠王, #夺冠, #每日AI快讯

谷歌Gemini 1.5 Pro（0801）登顶LMSYS竞技场，GPT-4o被超越，AI界掀起新一轮竞赛

量子位讯 谷歌新模型Gemini 1.5 Pro（0801）在LMSYS竞技场中取得重大突破，首次夺得第一名，并包揽总榜和视觉排行榜双冠王。这一消息引发了AI界广泛关注，也让OpenAI的GPT-4o面临新的挑战。

Gemini 1.5 Pro（0801）表现亮眼，GPT-4o被超越

根据LMSYS竞技场官方数据，Gemini1.5 Pro（0801）在历时一周的匿名投票中，以绝对优势战胜了GPT-4o，成为新的冠军。该模型在总榜中唯一突破1300分，并在视觉排行榜上也取得第一名。

Gemini团队负责人Simon Tokumine对这一成就表示兴奋，称Gemini 1.5 Pro（0801）是谷歌迄今为止制作的最强大、最聪明的模型。Reddit用户也对其评价颇高，认为该模型“非常好”，并希望其功能不会被缩减。

网友热议，OpenAI面临挑战

这一消息在社交媒体上引发热议，许多网友表示OpenAI终于迎来了挑战，并期待其发布新版本来反击。ChatGPT官方账号也暗示着什么，似乎正在准备新的动作。

Gemini 1.5 Pro（0801）并非完美，编码能力仍需提升

尽管Gemini 1.5 Pro（0801）在LMSYS竞技场中表现出色，但其编码能力仍不如Claude 3.5 Sonnet、GPT-4o、Llama 405B等对手。一些网友对此表示失望，认为编码才是最重要的，而Gemini 1.5 Pro（0801）在这方面的表现并不突出。

Gemma 2（2B）崛起，LMSYS竞技场权威性受质疑

与此同时，谷歌Gemma 2系列也迎来了一个新的20亿参数模型，Gemma 2（2B）。该模型在LMSYS竞技场排行榜上超过了所有GPT-3.5模型，甚至超越了Mixtral-8x7b。

然而，这一系列新排名也引发了人们对LMSYS竞技场权威性的质疑。一些专家指出，Gemma 2（2B）在MMLU上的表现远低于GPT-3.5 Turbo，而LMSYS竞技场只关注人类评估，可能无法全面反映模型的真实能力。

AI界竞赛不断升级，未来充满期待

谷歌Gemini 1.5 Pro（0801）的崛起，标志着AI界竞赛进入新的阶段。OpenAI、谷歌等巨头将继续投入研发，不断推出更强大的模型，为用户带来更智能、更便捷的体验。未来，AI技术将如何发展，我们拭目以待。