llm

投稿

研究指出推理模型对 LLM 无实质能力提升

清华大学与上海交通大学的一项新研究，已在世界领先的机器学习会议 NeurIPS 上获得最高荣誉，指出可验证奖励强化学习（RLVR）虽能提升大型语言模型（LLMs）的效率，却未能赋予…

数码技巧itech
2025年11月12日
投稿

研究指 LLM 模型 Benchmark 存在重大缺陷无法反映真实能力

一项新的国际研究指出，大型语言模型（LLM）Benchmark存在重大问题，显示大多数目前的评估方法存在严重缺陷。研究人员审查了来自顶级 AI 会议的 445 篇基准测试论文后发…

GM游戏评测
2025年11月9日