媒体和娱乐业正视生成式人工智能的前景和挑战

来源:传播与制作
关键字:媒体,娱乐,人工智能
发布时间:2023-10-08 15:55

　　凯文·希尔顿

　　这种更进化的AI形式可以创造不同类型的内容，从文字和图像到音频和合成数据，这些内容更逼真更有人情味，而不是明显由机器产生的东西。处于这一领域最前沿的是ChatGPT（生成式预训练转换器），尽管它在2022年11月才推出，但已经从根本上改变了语音、文字和图像自动化创建的方向。

　　快速精准

　　就像“新”技术往往出现的情况一样，广播公司和媒体制作公司在过去十年中就已经可以使用AI的许多功能。

　　“ 多年来，我们一直在我们的工具中实现A I，所以我们对ChatGPT并不很以为然，”Vizrt产品营销副总裁安德烈•托斯维克表示，“AI被用来让计算机做它们最擅长的事情，也就是快速和精准。人类很难做到这一点，例如，运动场上户外抠像。AI可以更快地做出反应，最终结果是一个更好的抠像，你不会在球员身上看到闪烁或广告。”

　　生成式AI在广播中最常见的应用包括：

　　● 图像生成和视频合成

　　● 自动化制作

　　● 辅助视频编辑

　　● 为自动“日志”创建元数据

　　● 字幕、片段搜索和媒体资产再利用

　　● 自动升高内容分辨率

　　● 音频和视频流编码/解码

　　未来咨询公司首席技术分析师西蒙·福雷斯特评论说，AI能够帮助艺术家和制作人更快地创作内容，实现“更快的迭代、更多的探索，并提供接近统一构成的媒体资产”

　　AI的另一个辅助应用是改进档案搜索。这一直是弗劳恩霍夫智能分析和信息系统研究所（IAIS）的一个特别研究领域。弗劳恩霍夫IAIS语音技术部门负责人克里斯托弗·施密特博士解释说，它超出了关键字技术的范围，AI和自然语言处理提供了“寻找相关档案内容制作新节目的改进方式”。

　　高效和动态

　　除了减少操作人员执行的重复性任务数量，让创意人员更快更好地完成工作之外，索尼欧洲战略技术经理彼得·赛克斯认为，AI“使整个媒体供应链尽可能高效和动态，帮助分析和解决资源分配以及优化它们的过程步骤，从而做出更好的业务决策。”

　　索尼于2020年成立了AI部门，重点在于成像和传感、游戏、烹饪（机器人操作食物和烹饪器具）及AI伦理等领域的项目。

　　在广播方面，索尼提供其A2制作系统，它除了其它功能外，还可以通过自动记录和场景检测功能识别体育赛事精彩时刻。它还通过其子公司Nevion开发的VideoIPath媒体调度平台，将AI应用于软件定义网络。

　　Ross Video在其两个主要业务部门实施AI：机器人摄像和新闻演播室系统。这两种系统都将AI集成到它们的产品线中，机器人使用的是内置在其产品中的更专有的技术，而新闻则依赖第三方AI引擎。

　　Ross Video新闻演播室计算机系统产品经理珍·贾维斯表示，这让客户可以选择他们想要使用的引擎，并为如何将其集成到产品中提供了一个框架。“我们现在也在关注内容创作方面，这是我们仍在探索的AI新方面的一部分，看看它如何融入新闻工作流程，”她说。

　　“但AI的下一个发展方向是‘主持人跟踪’应用，很多人已经提出了这个想法，”她说，“你不需要任何人为干预，所以你可以预先设置，以及设置你希望主持人出现在镜头中的位置。这是与主持人无关完成的，并可以对不同的主持人配置。它消除了一些人工干预，我认为这是AI在消除一些单调的调整方面的优势。”

　　减少单调乏味

　　利用AI消除（或至少减轻）现场制作中大量枯燥但必需的元素，现在是一个现实的问题。Avid工程研究员罗伯·冈萨尔夫斯说明了这一点，他举了Open AI的Whisper语音文字转换模型的例子。

　　“它可以应用于直播转录和广播信号内多种语言实时翻译，同时切换多达100种语言，”他说。

　　作为自动图像定位研究的一部分，Avid还测试了OpenAI的CLIP模型和通用GRoIE ROI（感兴趣区域）提取器。

　　“这是跟踪有最大语义兴趣镜头的区域，”冈萨尔夫斯解释道，“传统搜索方法是用描述镜头中的内容之元数据标签手动注释媒体资产。使用AI对象或面部识别现在可以自动扫描和注释过程。语义搜索做了类似的事情，但通过在片段中创建嵌入信息，它允许编辑对场景进行自由文本搜索。”

　　英伟达专业广播全球行业营销主管塞皮•莫塔米迪评论道，“现场制作，尤其是体育赛事，大量利用了”AI。“它被用于超级慢动作回放，使球场上看到的广告短暂停留在某一位置，快速生成比赛精彩时刻，通过视频标记（包括球场定标和运动员跟踪）提供额外的数据层，当然还有摄像机跟踪。”

　　Vertitone是最早开始将AI应用于广播的开发商之一。该公司成立于2014年，提供企业AI操作系统平台aiWARE，以及ChatGPT、音频、生物统计、语音、数据和视觉引擎。

　　“ 我们意识到，在媒体和娱乐市场开始为全球音频和视频内容编索引是一个机会，”Veritone媒体和广播总经理保罗•克莱默评论道。他补充说，一旦素材被编索引，生成式AI就可以用来“为正在寻找定制内容的消费者创造一种新的个性化体验”。这可以采用为对某种内容（如太空探索）感兴趣的观众定制的新闻镜头形式实现。

　　从广到小众

　　随着AI在整个媒体领域被更广泛地采用，它正在被用于非常小众和相当广泛的应用。Moveme.tv展示了一个高度专业化的用途:其搜索平台旨在帮助观众通过使用描述性词语和表情符号将电影与他们的情绪相配。创始人、首席执行官本·波金霍姆表示，最终目标是让人们能够创建“自己的超个人化娱乐频道”。

　　在更广泛的广播层面，英国广播公司（BBC）的研发部门在2017年用一个原型视频编辑包开始“媒体制作领域AI”计划，该编辑包可以自动选择镜头并将其组合入完成的作品。这项工作至今仍在继续，并于去年扩展，增加“智能摄影”新数据集，协助取景构图和编辑。BBC研发部门将很快宣布其对生成式AI的立场。

　　AI现在被各种类型和规模的新老媒体创作者和组织所利用。视频营销平台Vimeo 6月宣布，它正在研制一款生成式AI驱动的简化视频制作过程的“创作套件”。该软件包包括一个脚本生成器、提词器和基于文本的编辑系统，可以自动删除填充词和长停顿。

　　在更传统的方面，全英草地网球俱乐部正在利用IBM沃森平台的生成式AI功能，在其APP和网站上为2023年温布尔登锦标赛的视频集锦制作解说。

　　尽管具有这种创新精神，但AI在媒体专业人士中还是引起了不安，无论是在潜在的失业方面，还是在技术被滥用的风险方面。包括《纽约时报》和NBC新闻台在内的主要新闻媒体最近担忧，生成式AI不仅可能让记者下岗，而且可能让不法之徒炮制出虚假但相当可信的新闻。

　　美国联邦通信委员会有自己的AI工作组，它最初关注的主题之一是利用该技术改进其服务，包括使用AI更有效地管理频谱。该委员会7月与美国国家科学基金会联合举办一次，讨论AI给电信和技术部门带来的可能性和危险。

　　在英国，媒体监管机构英国通信管理局虽然承认生成式AI提供了一些好处，比如为更好的安全技术提供综合数据培训，但也同样强调了虚假新闻及其它媒体内容的危险。英国通信管理局目前正在严重关切生成式AI的发展，考虑如何将其积极方面最大化，同时也观察更多消极方面可能带来的威胁。

　　至于AI对人类的影响，RossVideo的凯伦•沃克认为“许多创造性的事情必须由人类来完成——人类将与AI并肩工作。”

　　Veritone的保罗•克莱默总结道：“生成式AI不会取代人类，但它会取代那些不使用AI的人类。”

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容