专题:OpenAI发布文生视频模型
OpenAI周四发布了首个视频生成模型Sora,该模型的主要功能是可以提供文本转视频。斯坦福大学博士生、师从李飞飞教授的Jim Fan(范麟熙)对Sora进行了点评:
以下为Jim Fan的点评内容,由知名互联网资讯博主“宝玉xp”翻译:
如果真有某个超越我们认知的存在编写了构成我们现实世界的模拟程序代码,我们甚至可以尝试估算这个程序编译后的二进制文件大小。以Meta AI开发的Emu Video为例,它拥有60亿参数。假如说有一个名为Sora的系统,其规模是Emu Video的10倍,并采用了bfloat16格式,那么这位“创造者”的程序大小可能不会超过111Gb。
但这里有几点需要注意:
- 实际上,这样的代码可能比我们设想的Sora系统要简单得多,因为Sora离达到Kolmogorov复杂度(一种衡量对象信息量的方法,代表了最短的无损压缩数据长度)还有很长的路要走;
- Sora系统的设计不仅仅是为了模拟我们所知的世界,而是能够包含所有可能存在的世界。换句话说,我们所经历的现实只是Sora能够模拟出的众多可能性之一;
- 就像在游戏设计中,使用虚幻引擎5(Unreal Engine 5)创建逼真场景时不需要渲染出每一个细节,我们的物理世界也可能在我们未观察它之前的某些部分实际上是不存在的。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:于健 SF069