llm
-
研究指出推理模型对 LLM 无实质能力提升
清华大学与上海交通大学的一项新研究,已在世界领先的机器学习会议 NeurIPS 上获得最高荣誉,指出可验证奖励强化学习(RLVR)虽能提升大型语言模型(LLMs)的效率,却未能赋予…
-
研究指 LLM 模型 Benchmark 存在重大缺陷 无法反映真实能力
一项新的国际研究指出,大型语言模型(LLM)Benchmark存在重大问题,显示大多数目前的评估方法存在严重缺陷。 研究人员审查了来自顶级 AI 会议的 445 篇基准测试论文后发…
