Tweet Overview
View this X/Twitter post from @imxiaohu published on 17 de dezembro de 2025 às 04:03. This post contains 4 videos and 1 images.
兄弟们,这个牛P Meta 推出「SAM Audio」 让声音也能“像图像一样被轻松分割”的 AI 模型 “就像 Photoshop 能抠图,SAM Audio 能‘抠声音’ 它可以理解并“分割”复杂音频中的任意声音元素,比如: 🎸 一键提取歌曲中的吉他或人声 🚗 过滤户外视频的交通噪音 🐶 去除播客录音里的狗叫声 不需要专业混音知识,也不必安装复杂软件 它能像图像“抠图”那样“抠声音” 真正让音频剪辑“像文字和图片一样简单”
支持三种提示方式(Prompts) 文本提示:直接用自然语言告诉它“提取吉他声”、“去掉人声” 就行,非常简单
视觉提示:点选视频里的对象 点击视频中的人物手 → 提取保留她的声音
时间提示: 选中视频中的时间范围标记 例如去掉:1:10–1:20 的噪音
这些提示方式可以单独使用,也可以任意组合 比如: “在 0:30–1:00 之间,提取女声。” 模型是开源的,详细介绍:https://www.xiaohu.ai/c/a066c4/meta-sam-audio-ai







