英伟达人工智能新模型能修改声音

  • 来源:电脑报
  • 关键字:英伟达,人工智能,芯片
  • 发布时间:2024-12-22 20:27

  芯片制造商英伟达近日展示了一种新型人工智能模型,可生成音乐与音频。这项技术旨在服务于音乐、电影和视频游戏制作领域,能够调整声音并生成独特音效。

  作为全球最大的人工智能系统芯片和软件供应商,英伟达表示,这项名为“Fugatto”(FoundationalGenerative Audio TransformerOpus 1)的技术目前尚无公开发布计划, 尽管这一技术潜力巨大。与Runway 等初创公司和Meta 等科技巨头展示的类似技术相比,英伟达的Fugatto 模型具备独特功能:不仅能根据文本提示生成音频或音乐,还能实现创新音效,例如让小号发出狗叫声。

  此外,Fugatto 还可以处理现有音频。例如,它可以将钢琴旋律转换成人声演唱,或调整录音的口音与情感表达。英伟达应用深度学习研究副总裁布莱恩·卡坦扎罗表示:“过去50 年的音乐因电脑和合成器发生了显著变化。我相信,生成式人工智能将为音乐、电子游戏以及普通创作者带来前所未有的能力。”

关注读览天下微信, 100万篇深度好文, 等你来看……