谷歌Gemini 1.5 Pro(0801)登顶LMSYS竞技场,GPT-4o被超越,AI界掀起新一轮竞赛
量子位讯 谷歌新模型Gemini 1.5 Pro(0801)在LMSYS竞技场中取得重大突破,首次夺得第一名,并包揽总榜和视觉排行榜双冠王。这一消息引发了AI界广泛关注,也让OpenAI的GPT-4o面临新的挑战。
Gemini 1.5 Pro(0801)表现亮眼,GPT-4o被超越
根据LMSYS竞技场官方数据,Gemini1.5 Pro(0801)在历时一周的匿名投票中,以绝对优势战胜了GPT-4o,成为新的冠军。该模型在总榜中唯一突破1300分,并在视觉排行榜上也取得第一名。
Gemini团队负责人Simon Tokumine对这一成就表示兴奋,称Gemini 1.5 Pro(0801)是谷歌迄今为止制作的最强大、最聪明的模型。Reddit用户也对其评价颇高,认为该模型“非常好”,并希望其功能不会被缩减。
网友热议,OpenAI面临挑战
这一消息在社交媒体上引发热议,许多网友表示OpenAI终于迎来了挑战,并期待其发布新版本来反击。ChatGPT官方账号也暗示着什么,似乎正在准备新的动作。
Gemini 1.5 Pro(0801)并非完美,编码能力仍需提升
尽管Gemini 1.5 Pro(0801)在LMSYS竞技场中表现出色,但其编码能力仍不如Claude 3.5 Sonnet、GPT-4o、Llama 405B等对手。一些网友对此表示失望,认为编码才是最重要的,而Gemini 1.5 Pro(0801)在这方面的表现并不突出。
Gemma 2(2B)崛起,LMSYS竞技场权威性受质疑
与此同时,谷歌Gemma 2系列也迎来了一个新的20亿参数模型,Gemma 2(2B)。该模型在LMSYS竞技场排行榜上超过了所有GPT-3.5模型,甚至超越了Mixtral-8x7b。
然而,这一系列新排名也引发了人们对LMSYS竞技场权威性的质疑。一些专家指出,Gemma 2(2B)在MMLU上的表现远低于GPT-3.5 Turbo,而LMSYS竞技场只关注人类评估,可能无法全面反映模型的真实能力。
AI界竞赛不断升级,未来充满期待
谷歌Gemini 1.5 Pro(0801)的崛起,标志着AI界竞赛进入新的阶段。OpenAI、谷歌等巨头将继续投入研发,不断推出更强大的模型,为用户带来更智能、更便捷的体验。未来,AI技术将如何发展,我们拭目以待。
Views: 0