刚刚,OpenAI发布Sora2,AI视频GPT-3.5时刻来了,还有一个超好玩的app
本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《刚刚,OpenAI发布Sora 2!AI视频GPT-3.5 时刻来了,还有一个超好玩的app| 附下载链接》
国庆长假的第一天,OpenAI直接扔出了一颗真「核弹」:Sora 2,以及一个可能重塑社交格局的新应用——Sora。
如果说一年多前的Sora让我们看到了AI视频的黎明,那么Sora 2就直接把我们拽进了正午的太阳底下,刺眼、灼热,又无比真实。
这次不再只有技术演示,而是直接为此开发了一款新app给C端用户体验。
OpenAI也极为罕见地,直接把Sora 2称为AI视频生成的「GPT-3.5时刻」。
看完Sora 2的发布和体验,我发现OpenAI这次的自信是真有底气,不是奥特曼式的自吹自擂。
关于真实的定义被推到了必须重新讨论的时刻。一个全新的物种,一个崭新的时代,开始了。
奥特曼刚刚也发了长文,认为这是「创意领域的ChatGPT」时刻,创意将迎来「寒武纪爆发」。
APPSO第一时间给大家全面总结了Sora 2和Sora app的核心功能和新玩法,以及使用方式。
Sora 2
1.首次实现音视频同步生成:生成画面的同时生成与之匹配的环境音、物体交互声,甚至是符合语境的对话
2.强得可怕的物理精确性:能够进行与真实世界动力学更一致的物理仿真。
3.真实感大幅提升:在图像分辨率、细节程度和真实感方面都有所提升。
4.能更灵活地适应用户想要的风格,风格操控能力增强。
5.一致性更强,对用户指令的遵循的比之前的模型有所提高。
Sora app
1.客串(Cameo):Sora app最大亮点,用户可以将自己或朋友以逼真的效果融入任何AI生成的场景中。
2.Remix:用户可以对彼此创作的视频进行「混编」或二次创作,共同创作。
怎么体验
1.Sora app下载链接(目前只有iOS没有安卓)
https://apps.apple.com/us/app/sora-by-openai/id6744034028
2.网页版sora.com
3.地区支持:今天起在美国、加拿大首发,其他国家和地区将逐步开放
4.邀请码机制:无论是iOS应用还是网页版都需要邀请码才能使用。现在就可以去下载App或访问网站注册排队。
5.价格:Sora 2初期将免费提供,并有相对宽松的使用限制ChatGPT Pro用户还能在网页版抢先体验更高质量的Sora 2 Pro模型
6.OpenAI也将会发布API,让更多开发者加入。
Sora 2:不再是在「生成」,而是在「模拟世界」
Sora 2的核心突破,是它从一个「视频生成器」,进化为一个「世界模拟器」。
理解物理世界,一直的AI视频最大的难点。以前的AI视频,物体经常会奇怪地穿模、漂浮正是源于无法准确理解物理世界的交互。
在Sora 2的视频里,体操的动作,原地连续后空翻、跳水等等这些动作都很自然符合力学,水花溅起的样子也符合流体力学。
OpenAI的终极目标是构建「通用世界模拟器」(general-purpose world simulator),即让AI理解我们世界的物理规则。
Sora 2就是其中的关键一步。你可以把它想象成一个在虚拟世界里不断做物理实验的学生,通过观察无数视频,它正在自己总结牛顿定律、流体力学和光学原理。
对于任何有用的世界模拟器来说,这是一项极其重要的能力——你必须能够模拟失败,而不仅仅是成功。
这种对现实世界复杂性的模拟,才是Sora 2最可怕的进化。
Sora 2的另一个重大突破,是在生成画面的同时,还能同步生成与之匹配的环境音、物体交互声,甚至是符合语境的对话。
虽然AI视频和音频现在都很强,但「声画一体」带来的真实感完全不同,这让AI视频真正拥有了「灵魂」。
这对模型的要求极高,比如你让AI生成「一只猫在键盘上走过,发出不满的喵喵声」。
模型得知道「猫长什么样」,也学习了「猫的叫声是怎样的」,并将这两者牢牢绑定。还要理解了「敲击键盘」这个动作,才会「咔哒」声。
此外Sora在可控性方面也有了巨大飞跃,能够遵循跨多个镜头的复杂指令,同时准确地保持世界状态,比较擅长写实、电影和动漫风格。
Sora App:打造你的AI「人生」
昨天曝光的「AI抖音」,就是Sora App,不过看下来OpenAI想做的远不止一个社交应用。
Sora App直接支持Sora 2模型生成,里头最好玩的应该就是「客串(Cameo)」,你只需在录制一段简短的视频和音频(用于活体验证和形象捕捉),你就可以把自己「投放」到任何AI生成的场景里。
上一秒你还在办公室,下一秒你就可以出现在《沙丘》的沙漠星球上,仰望双月,Sora还会根据沙漠的光线,给你脸上加上逼真的光影。
是不是有点视频版nano banana那味了
整个过程就像拍个自拍视频一样简单。Sora会捕捉你的形象、声音和神态,然后你就可以在生成视频时,像选择一个贴纸一样,把自己「贴」进去,而且是3D、无缝、高度逼真的那种。
OpenAI内部员工已经因为这个功能在公司交到了新朋友。
你可以和朋友们一起「客串」到同一个场景里,上演一出属于你们的科幻大片。这是一种全新的交流方式,从文字、表情包、语音,进化到了「共同体验」的视频媒介。
在Sora App的信息流里,你看到的每一个视频都是AI生成的。
如果看到一个喜欢的视频,直接点击「Remix」,你可以修改提示词,把「赛博朋克雨夜」改成「阳光明媚的午后」,或者用「客串」功能把自己加进去,变成故事的主角。
Sora会保留原视频的结构或风格,让你在它的基础上进行修改和再创作,就像转发微博再加一句评论一样简单。
当然,这些功能不可避免地会引发对于隐私和侵权问题的担忧。
Sora也对此做了应对措施,只有用户本人可以决定谁能使用自己的「客串」形象,用户可以随时撤销访问权限,或删除任何包含自己形象的视频,即使是他人创建未发布的草稿也不例外。
OpenAI表示,包含电影或视频中真实人物影像的上传在初期将被禁止或受到严格监管,而涉及儿童的内容将有严格过滤:含有儿童的场景将实施严格的审查门槛。
现实,这次真不存在了?
Sora 2和Sora App带来的,远不止是好玩,它正在从根本上动摇我们对「真实」的定义。
Sora 2的发布,或许标志着我们与现实的关系将进入一个新的纪元。我们每个人都获得了重塑世界、重塑自我的「魔法」。
现在,我们可能不是主动选择逃离现实,而是「现实」本身正在失去其作为我们生活参照系的核心地位。
Sora App通过提供极致的创造乐趣和社交连接,正在构建一个引力极其强大的新现实中心。它并非在你的现实生活之外提供一个「虚拟分身」,而是在试图成为你生活的「新背景」。
当你的社交关系(和朋友在AI世界冒险)、身份认同(在虚拟世界里成为超级英雄)、创意表达(Remix全世界)都优先发生在这个平台之上时,那个需要你偶尔「登出」才能回去处理水电费账单的物理世界,反而会沦为一个偶尔才需要访问的「副本」。
这属实就是《头号玩家》了,所以说OpenAI的尽头是元宇宙?小扎默默点了个赞。
OpenAI自己也坦言,他们曾对纯AI生成信息流持怀疑态度,但最终被其带来的人际连接感所惊喜。
奥特曼在最新的博客中直言,AI视频生成可能会走向堕落,最终导致我们都被吸入一个经过强化学习优化的「垃圾信息流」。
他表示Open AI试图找出如何打造一款既能带来愉悦又不落入这种陷阱的产品。
Sora这个app,就是他们交出的第一份答卷。
在通往AGI的路上,收获的不应该只是生产力,也关乎创造力和快乐。
欢迎来到这个由想象力驱动的新世界。现在,唯一的问题是,你拿到邀请码了吗?
欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知
我们正在招募伙伴
简历投递邮箱hr@ifanr.com
✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
相关推荐
刚刚,OpenAI发布Sora2,AI视频GPT-3.5时刻来了,还有一个超好玩的app
刚刚,Sam Altman 反思来了:OpenAI将朝着超级智能迈进
刚刚,OpenAI 发布ChatGPT 版Manus,奥特曼:感受AGI 时刻
刚刚,OpenAI又发布了一个“期货”
OpenAI CEO发布长文:我们已经知道如何构建AGI
“类人速度”新模型来了?OpenAI发布新款AI模型GPT-4o,响应时间接近人类水平,AI进入《她》时代?
曝OpenAI 将推出“AI 抖音”:禁止上传实拍内容,Sora2加持
短短45分钟发布会,OpenAI如何再次让AI圈一夜未眠
ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步
ChatGPT-4o,OpenAI的一小步,人类“AI助理”的一大步
网址: 刚刚,OpenAI发布Sora2,AI视频GPT-3.5时刻来了,还有一个超好玩的app http://www.xishuta.com/newsview142588.html
推荐科技快讯

- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519