AIGCLINK (@aigclink) - 苹果新搞了一个RAG框架：ml-clara，解决长上下文处理效率低下、检索与生成优化过程的分离问题其核心思想是，不要把整段文本塞给大模型，而...

28 Kasım 2025 02:57

Tweet Overview

View this X/Twitter post from @aigclink published on 28 Kasım 2025 02:57. This post contains 1 images.

苹果新搞了一个RAG框架：ml-clara，解决长上下文处理效率低下、检索与生成优化过程的分离问题

其核心思想是，不要把整段文本塞给大模型，而是把“检索”和“生成”全部压缩到同一个可微的连续向量空间里，统一训练、一次推理

以此解决，1 上下文越来越长计算量爆炸，2 检索器和生成器独立训练导致优化目标不一致，3 梯度断流的问题

在NQ、HotpotQA、MuSiQue、2Wiki上，不同压缩比4×/16×/32×均保持领先，压缩到32×时仍优于未压缩的纯检索基线

上下文长度最高可压32×–64×，同时保留了生成准确答案所需的基本信息

具体是，1、首先压缩预训练，把文档压成32～256维向量，保留QA/复述语义

2、然后指令微调，让压缩向量适配下游问答任务

3、再端到端联合训练，检索器+生成器一起优化

#RAG #mlclara

github：https://github.com/apple/ml-clara

字节发布了一款端到端同声传译模型：Seed LiveInterpret 2.0，中英双向端到端同传，延迟为2-3秒从演示效果看，准确性、复杂场景的处理、声音情绪的表达、语音克隆音色转换的效果相对都还可以性能上，语音到语音翻译，中英互译平均翻译质量到了66.3分，接近专业真人同传水平 https://t.co/5fpjBxMLdX

字节开源了：DeerFlow，基于LangChain和LangGraph框架的一款智能研究助手支持动态任务迭代、MCP无缝集成、自动生成研究计划、人机协作，甚至是播客、PPT生成它把语言模型与网络搜索、爬虫和Python代码执行等工具结合在一起，以快速提供深入且全面的报告 #AI研究助手 #DeerFlow #MCP

一款开源的实时AI语音聊天助手：RealtimeVoiceChat，语音听起来相对自然，支持打断双向语音交互，延迟低，可以实时看到语音转录，以及AI的回复内容用来构建客服、教育或陪伴等等场景的AI语音助手比较实用 #AI语音助手

一款PDF文档快速总结AI工具：SmartPDFs 丢给它一份PDF文档，它能分段整理出一份简洁带有核心内容的分段总结对经常需要阅读大量长篇PDF的用户比较实用 #AIpdf文档处理工具 #SmartPDFs

Tweet Overview

More from @aigclink

Related Creators

Free Twitter video downloader. Top Twitter trends and hashtags list, Monitor, track hottest trending topics, hashtags.

Diğer bağlantılar

İndirici

İlgili ürünler

© 2024 TwitFast Her hakkı saklıdır.