Meta的SAM Audio解析(以及为何重要)

Meta发布了一款名为SAM Audio的音频源分离工具,用户只需输入文本提示(如"woman"、“footsteps”),即可从任意视频或音频中精准提取特定声音元素。该工具继承SAM系列的prompt-based架构,支持语音增强、噪音消除、乐器分离等多种场景,完全免费开源。创作者可在官方Playground实时体验三轨输出(原始、隔离声、反向隔离),也可下载模型本地部署。实测展示了对游戏人声、嘈杂餐厅背景音、乐器音轨等的出色分离效果,文末附多种音频后处理特效演示。

January 6, 2026 · 5 min · 2296 words · AIcan