发米下载:值得大家信赖的游戏下载站!

所在位置: > 区块链 > OpenAI 推出 Sora 2,搭载 TikTok 风格社交应用,让你身临其境

OpenAI 推出 Sora 2,搭载 TikTok 风格社交应用,让你身临其境

发布时间:2025-10-01 04:00:37来源:发米下载作者:zhoucl

本站报道:

OpenAI 周二发布了 Sora 2,将其最新的视频生成模型与一款新的社交应用配对,让用户能够创作、分享和出演 AI 生成的视频片段。该公司称,此次发布是模拟物理现实的一大进步,该模型首次实现了与视频同步的音频。

更新后的模型可以生成展现早期系统难以处理的复杂物理交互的视频片段。在一些示例中,Sora 生成了奥运会体操动作、桨板上的后空翻以及人物表演的三周半跳,且没有任何明显的失真或变形。与之前那些为了满足文本提示而扭曲物理规律的视频生成器不同,Sora 2 尝试模拟现实结果,包括失败。

OpenAI 在其报告中表示:“之前的视频模型过于乐观——它们会变形物体并扭曲现实,以便成功执行文本提示。”公告. Sora 2“与之前的系统相比,在遵守物理定律方面做得更好。”

该模型直接从文本提示生成背景音景、语音和音效。到目前为止,唯一具有此功能的模型是谷歌Veo 3该系统还可以处理多镜头序列,同时保持场景变化的连续性,这也非常复杂,需要对角色和环境有深入的了解。

OpenAI 将 Sora 2 宣传为“视频领域的 GPT-3.5 时刻”,并将其与 ChatGPT 之前的语言模型进行比较。最初的 Sora 于2024年2月,代表了该公司所谓的“GPT-1时刻”——这是视频生成开始大规模发挥作用的第一个迹象。

很多更好的模型很快就把 Sora 甩在身后,以至于当 OpenAI 决定发布其模型时,中国的替代方案已经能够输出更好的结果,更连贯的视频使用相同的提示。

目前,测试该模型的唯一方法是通过新的 iOS 应用程序进行邀请,简单地命名为 Sora与之前的只能通过网站访问且专注于独立视频生成的模型不同,该应用程序看起来更加精致和多功能,引入了一项名为“cameos”的功能,让用户可以将自己插入生成的场景中。

录制一段简短的视频验证身份,并捕捉外貌和声音后,用户即可出现在任何 Sora 创造的环境中。该功能适用于人类、动物或物体,用户可以控制谁可以使用自己的肖像。

在演示过程中,OpenAI 团队制作了自己的视频,其中包含广告、踢翻动作以及在不同情况下的表演,风格类似于 TikTok 视频或 Instagram Reel。

该应用包含一个可定制的信息流,使用了OpenAI所谓的新型推荐算法,该算法可以接受自然语言指令。系统默认显示用户关注或互动的用户内容,该公司表示,它不会针对用户滚动浏览的时间进行优化。内置机制会定期调查用户的健康状况,并提供调整信息流设置的选项。

对于青少年,该应用包含对动态中每日可见代数的默认限制,以及对客串的更严格权限。家长可以通过 ChatGPT 访问控件,以管理滚动限制、算法个性化和私信设置。

用户将完全掌控自己的客串,并可随时撤销访问权限或删除包含自己相似内容的视频。该应用会向用户展示所有客串视频,包括其他人创作的尚未发布的草稿。

Sora 2 正在美国和加拿大通过邀请制推出,并计划迅速扩展到其他国家。该服务将免费,但 OpenAI 称其有“宽松的限制”,尽管这些限制仍然受到计算能力的限制。ChatGPT Pro 订阅用户可以访问名为 Sora 2 Pro 的实验性更高质量版本。该公司计划通过其 API 发布 Sora 2,并保留早期的 Sora 1 Turbo 型号。

OpenAI 表示,如果需求超过可用的计算资源,Sora 2 最终将为用户提供付费购买额外代次的选项。

目前,如果您没有邀请码、iPhone 或 ChatGPT Pro,唯一的选择就是使用 Veo 3 的有限运行次数或使用 Wan 等本地视频生成器。当然,也有更便宜的选择,例如 Kling、Seedance、Hailuo 或 Runway,但拥有一个高度逼真且具备社交媒体功能的视频模型,无疑是业内其他公司无法比拟的优势。

  • 热门资讯
  • 最新资讯