英伟达人工智能新模型能修改声音

来源:电脑报
关键字:英伟达,人工智能,芯片
发布时间:2024-12-22 20:27

　　芯片制造商英伟达近日展示了一种新型人工智能模型，可生成音乐与音频。这项技术旨在服务于音乐、电影和视频游戏制作领域，能够调整声音并生成独特音效。

　　作为全球最大的人工智能系统芯片和软件供应商，英伟达表示，这项名为“Fugatto”（FoundationalGenerative Audio TransformerOpus 1）的技术目前尚无公开发布计划，尽管这一技术潜力巨大。与Runway 等初创公司和Meta 等科技巨头展示的类似技术相比，英伟达的Fugatto 模型具备独特功能：不仅能根据文本提示生成音频或音乐，还能实现创新音效，例如让小号发出狗叫声。

　　此外，Fugatto 还可以处理现有音频。例如，它可以将钢琴旋律转换成人声演唱，或调整录音的口音与情感表达。英伟达应用深度学习研究副总裁布莱恩·卡坦扎罗表示：“过去50 年的音乐因电脑和合成器发生了显著变化。我相信，生成式人工智能将为音乐、电子游戏以及普通创作者带来前所未有的能力。”

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容