推文概览
查看 @op7418 在 2025年5月2日 03:45 发布的这条 X/Twitter 推文。 这条内容包含 2 张图片。
LLM 竞技场 lmarena ai 最近受到越来越多的质疑 很多人觉得他们的结果和自己的体验不一样,也有论文在研究这些,尤其是Llama 4这次 现在来看可能真实反映用户使用喜好的产品上的模型排名才是客观的 比如Cursor发布了“开发者偏好AI模型”排名和 Openrouter 的模型Token使用量排名


查看 @op7418 在 2025年5月2日 03:45 发布的这条 X/Twitter 推文。 这条内容包含 2 张图片。
LLM 竞技场 lmarena ai 最近受到越来越多的质疑 很多人觉得他们的结果和自己的体验不一样,也有论文在研究这些,尤其是Llama 4这次 现在来看可能真实反映用户使用喜好的产品上的模型排名才是客观的 比如Cursor发布了“开发者偏好AI模型”排名和 Openrouter 的模型Token使用量排名


来自 歸藏(guizang.ai) 的收录推文
TwitFast