Tweet Overview
View this X/Twitter post from @axichuhai published on ১৬ জুলাই, ২০২৫ এ ০১:৫০ PM. This post contains 9 videos and 2 images.
Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现: • 研究 • 计划 • 编程 • 分析 其中一个彻底碾压了另一个。 你绝对想不到谁赢了。 (所有测试和提示在下方)👇

在开始阅读之前,记得点赞、转发或收藏🫶
1. 解决逻辑谜题(农夫过河问题) 提示: “一个农夫有狼、羊和卷心菜。他需要一次带一个物品过河,怎么做才能不让任何东西被吃掉?” 预期效果: 让我们看看谁能像人类一样一步步推理解决谜题。
2. 简化复杂研究(死网理论) 提示: “用150字以内解释‘死网理论’,就像对我这个好奇的12岁小孩一样。” 预期效果: 他们能把复杂想法讲得简单不呆板吗?
3. 撰写病毒式YouTube脚本 提示: “写一个短YouTube脚本(少于200字),标题是:‘我如何用AI自动化我的副业’。” 预期效果: 这个任务能分辨出谁真正懂内容创作,谁只是写写而已。
4. 扮演专业助理 提示: “起草一封礼貌拒绝供应商会议邀请的邮件,但为Q4留下合作可能。” 预期效果: 礼貌、得体,还得像真正的行政助理一样。
5. 进行逐步推理数学 提示: “如果我投资10000美元到一个年复利8%的基金,5年后会有多少?展示你的推理过程。” 预期效果: 是真会算还是随便写的?
6. 为AI图像生成模型编写提示 提示: “写一个提示,生成一个超现实科幻城市景观,包括飞车、霓虹灯和vaporwave美学。我会用这个提示在Midjourney、Flux、Google Gemini等工具上。” 预期效果: 看看谁更懂美学和提示结构。
7. 简化和法律术语 提示: “把这段简短的服务条款文本用简单英语总结给一个青少年。” (测试时插入真实TOS块) 预期效果: 他们能把法律术语翻译成15岁小孩能懂的语言吗?
8. 生成Python代码(网页抓取) 提示: “用Python和BeautifulSoup写代码,抓取Hacker News的前10条头条。” 预期效果: 哪个模型写的代码更干净、能运行且有注释?
9. 扮演治疗师处理倦怠 提示: “我感觉完全倦怠了。扮演治疗师,给我讲3个今天能做的改善方法。” 预期效果: 是真有同理心还是泛泛而谈?谁能像在乎我一样说话?
10. 比较两个SaaS工具(表格格式) 提示: “比较Notion和Coda,适合创业公司建立内部知识库。输出为表格。” 预期效果: 结构清晰、见解深刻、实用性强,看谁格式和思维更好。

原文来自Ryan Lazuka Copyright to original author. Will remove if any offensive. 如果您喜欢这个主题: 1.关注我(@axichuhai),探索AI在各行业的实际应用 2.点赞+转发下面第一条帖子 https://x.com/axichuhai/status/1945481181665034445
🚀涨价倒计时3天,马上恢复原价150元! 要开通GPT会员/要续期的,抓紧下手https://x.com/axichuhai/status/1943982807640158639






