智能新闻 AI Wake-Up Call Fails Large Language Model Plummets 39% in Multi-Turn Tests 2025年6月19日 引言 “你永远叫不醒一个装睡的人。” 这…
智能新闻 AI Flunks “Unsolvable” Puzzle Test Gemini 2.0 Others Score Zero 2025年2月18日 San Francisco, CA &#…