阿西_出海 (@axichuhai) - Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现： • 研究 • 计划 • 编程 • 分析其中一个彻底碾压...

১৬ জুলাই, ২০২৫ এ ০১:৫০ PM

Tweet Overview

View this X/Twitter post from @axichuhai published on ১৬ জুলাই, ২০২৫ এ ০১:৫০ PM. This post contains 9 videos and 2 images.

Grok 4 vs Claude 4  

有人测试了这两个模型在10个实际任务中的表现： 

• 研究
• 计划
• 编程
• 分析  

其中一个彻底碾压了另一个。  

你绝对想不到谁赢了。  

（所有测试和提示在下方）👇

在开始阅读之前，记得点赞、转发或收藏🫶

1. 解决逻辑谜题（农夫过河问题）  

提示：  

“一个农夫有狼、羊和卷心菜。他需要一次带一个物品过河，怎么做才能不让任何东西被吃掉？”  

预期效果：  

让我们看看谁能像人类一样一步步推理解决谜题。

2. 简化复杂研究（死网理论）  

提示：  

“用150字以内解释‘死网理论’，就像对我这个好奇的12岁小孩一样。”  

预期效果：  

他们能把复杂想法讲得简单不呆板吗？

3. 撰写病毒式YouTube脚本  

提示：  

“写一个短YouTube脚本（少于200字），标题是：‘我如何用AI自动化我的副业’。”  

预期效果：  

这个任务能分辨出谁真正懂内容创作，谁只是写写而已。

4. 扮演专业助理  

提示：  

“起草一封礼貌拒绝供应商会议邀请的邮件，但为Q4留下合作可能。”  

预期效果：  

礼貌、得体，还得像真正的行政助理一样。

5. 进行逐步推理数学  

提示：  

“如果我投资10000美元到一个年复利8%的基金，5年后会有多少？展示你的推理过程。”  

预期效果：  

是真会算还是随便写的？

6. 为AI图像生成模型编写提示  

提示：  

“写一个提示，生成一个超现实科幻城市景观，包括飞车、霓虹灯和vaporwave美学。我会用这个提示在Midjourney、Flux、Google Gemini等工具上。”  

预期效果：  

看看谁更懂美学和提示结构。

7. 简化和法律术语  

提示：  

“把这段简短的服务条款文本用简单英语总结给一个青少年。”  

（测试时插入真实TOS块）  

预期效果：  

他们能把法律术语翻译成15岁小孩能懂的语言吗？

8. 生成Python代码（网页抓取）  

提示：  

“用Python和BeautifulSoup写代码，抓取Hacker News的前10条头条。”  

预期效果：  

哪个模型写的代码更干净、能运行且有注释？

9. 扮演治疗师处理倦怠  

提示：  

“我感觉完全倦怠了。扮演治疗师，给我讲3个今天能做的改善方法。”  

预期效果：  

是真有同理心还是泛泛而谈？谁能像在乎我一样说话？

10. 比较两个SaaS工具（表格格式）  

提示：  “比较Notion和Coda，适合创业公司建立内部知识库。输出为表格。”  

预期效果：  

结构清晰、见解深刻、实用性强，看谁格式和思维更好。

原文来自Ryan Lazuka Copyright to original author. Will remove if any offensive.

如果您喜欢这个主题：

1.关注我（@axichuhai），探索AI在各行业的实际应用
2.点赞+转发下面第一条帖子
https://x.com/axichuhai/status/1945481181665034445

🚀涨价倒计时3天，马上恢复原价150元！

要开通GPT会员/要续期的，抓紧下手https://x.com/axichuhai/status/1943982807640158639

https://x.com/axichuhai/status/1941382458349584417

Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现： • 研究 • 计划 • 编程 • 分析其中一个彻底碾压了另一个。你绝对想不到谁赢了。（所有测试和提示在下方）👇

Tweet Overview

More from @axichuhai

Related Creators

Free Twitter video downloader. Top Twitter trends and hashtags list, Monitor, track hottest trending topics, hashtags.

অন্যান্য লিঙ্ক

ডাউনলোডার

সম্পর্কিত পণ্য

© 2024 TwitFast সর্বস্বত্ব সংরক্ষিত

Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现： • 研究 • 计划 • 编程 • 分析 其中一个彻底碾压了另一个。 你绝对想不到谁赢了。 （所有测试和提示在下方）👇

Tweet Overview

More from @axichuhai

Related Creators

Free Twitter video downloader. Top Twitter trends and hashtags list, Monitor, track hottest trending topics, hashtags.

অন্যান্য লিঙ্ক

ডাউনলোডার

সম্পর্কিত পণ্য

© 2024 TwitFast সর্বস্বত্ব সংরক্ষিত

Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现： • 研究 • 计划 • 编程 • 分析其中一个彻底碾压了另一个。你绝对想不到谁赢了。（所有测试和提示在下方）👇