OpenAI发布视频生成新模型Sora文

近日,人工智能领域的领军企业OpenAI再次取得突破性进展,宣布推出全新模型Sora。这款模型具备将文本提示转化为长达一分钟高清视频的能力,标志着人工智能在视频生成领域迈出了重要的一步。然而,为确保技术的安全和可控,Sora目前仅对一小部分学者和研究人员开放使用。

OpenAI在官方网站上详细介绍了Sora的功能和特点。他们表示,Sora能够生成包含多个角色、特定类型运动以及精确主题和背景细节的复杂场景。这一模型不仅理解用户在文本提示中所要求的内容,更能将这些事物与现实世界中的存在方式相结合,呈现出逼真的视频效果。

为了展示Sora的强大功能,OpenAI在网站上分享了一段由该模型生成的视频。视频中,一对情侣在雪花飘洒的东京街头漫步,樱花花瓣与雪花交织飞舞,营造出浪漫而唯美的氛围。

另一段视频则展示了栩栩如生的猛犸象在雪后草地上行走的场景,背景是白雪皑皑的山脉,整个画面逼真得令人难以置信。

OpenAI指出,Sora之所以能够实现如此出色的视频生成效果,得益于其对语言的深刻理解。这使得模型能够准确解读文本提示,并根据提示内容生成符合要求的视频。然而,与所有人工智能图像和视频生成器一样,Sora也存在一定的局限性。在某些情况下,模型可能会忽略文本提示中的某些元素或细节,导致生成的视频与预期略有出入。此外,OpenAI还提醒用户,该模型在理解因果关系方面可能存在一定困难。例如,在生成一个人吃饼干的视频时,饼干上可能没有咬痕等细节。

值得一提的是,Sora并非市场上首个文本到视频的模型。包括Meta、Google和Runway在内的其他科技公司也已经推出了类似的工具或将其公之于众。然而,与其他竞争对手相比,Sora在视频生成时长方面具备明显优势。目前尚无其他工具能够生成长达60秒的高清视频。此外,与其他逐帧生成视频的模型不同,Sora能够一次性生成整个视频,从而确保视频中的主题在暂时离开视线时仍保持一致性和连贯性。

随着文本到视频工具的兴起和发展,人们对其潜在滥用风险也表达了担忧。华盛顿大学专门研究人工智能的教授奥伦·埃齐奥尼(OrenEtzioni)在接受采访时表示:“我非常担心这类技术会被用于操纵选举等敏感领域。”同时,生成式人工智能的广泛应用也引发了艺术家和创意专业人士的担忧,他们担心这项技术会取代他们的工作岗位和创作空间。

为了应对这些挑战和担忧,OpenAI表示正在与误解信息、仇恨内容和偏见等领域的专家展开合作,对Sora进行严格的测试和评估。在确保技术安全可控的前提下,OpenAI还计划开发能够检测由Sora生成的视频的工具,并在生成的视频中包含元数据以便于识别和追踪来源。然而,关于Sora训练数据的具体细节,OpenAI方面并未透露太多信息,仅表示使用了公开可用的视频以及从版权持有者处获得许可的视频资源进行训练和优化工作。



转载请注明地址:http://www.1xbbk.net/jwbys/8945.html


  • 上一篇文章:
  • 下一篇文章:
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7