作者:文子
编辑:小迪
来源:新火种
OpenAI这把火烧的太大,也烧的太乱了。
核心团队被扒,13人里3人为华人
作为龙年科技界的“第一把火”,OpenAI最新爆款文生视频模型Sora的热度正在以惊人的速度持续发酵。
除了震惊世界的AI视频技术,其幕后主创团队也来到了聚光灯下。
据OpenAI发布的Sora技术报告,Sora作者团队仅有13人,其中3名为华人。
相比去年GPT-4超长篇幅的作者名单,Sora的作者团队显然更加简短。
这些参与者中,已知的核心成员包括研发负责人Tim Brooks、William(Bill)Peebles、系统负责人 Connor Holmes等。前两人师出同门,均在2019年进入伯克利深造,直到2023年上半年才一前一后获得博士学位,可以说是非常年轻。
值得注意的是,William(Bill)Peebles曾和现任纽约大学计算机科学助理教授谢赛宁一起发表过论文《Scalable Diffusion Models with Transformers》,该论文研究成果DiT模型被Sora引用,也是这次Sora背后的重要技术基础之一。
因为论文的引用也传出了一则谣言,有网友认为谢赛宁是Sora作者之一,目前谢赛宁本人已在朋友圈亲自辟谣。
根据谢赛宁的透露,Sora是William(Bill)Peebles等人在OpenAI的呕心沥血之作,每天基本不睡觉高强度工作了一年。
要知道,William(Bill)Peebles在2023年3月入职OpenAI,距今刚好不到一年。这也从侧面否定了之前传闻中的“Sora早就开发完成,只是一直没发”的言论。
未公测却卖课,新型韭菜收割机?
而市场上围绕着Sora的不仅仅有谣言,还有一系列巧立名目的骗局。
据知情人士透露,目前市面上一份Sora的课程售价为99元,一天时间就卖出了2万多份。也就是说,卖课者一天至少到手200万元。而课程交付的内容却极其简陋,只有Sora的介绍文档,以及一句口号:“给自己一个机会”。
无独有偶,甚至有人号称手上有北美NASA工作人员的资源,已经拿到接口,把Sora打包到GPTs,做成软件发布上线。
除此之外,还有搜集各类Sora文章、专有名词等资料,做成飞书文档卖钱的,也有直接套用影视行业专业名词包装成Sora的提示词,让人付费进群领取的,诸如此类各式各样打着Sora旗号收割韭菜的骗局。
更甚者还有人为了吸引人付费,不择手段地大力制造焦虑感,到处宣称“Sora的风口最多3个月就消失”、“一步慢,步步慢”,“24小时之内上线了一款连产品都没有发布的课程”。某电商平台上,也有人售卖Sora教程,甚至连宣传海报都是同一款,懒得另外重做。
这也直接迫使OpenAI的开发者关系负责人Logan发布紧急声明,称Sora正处于内测阶段,并未对外开放。即使开放,Sora能够作为产品使用的时间也仍旧遥遥无期。
而在卖课之外,也有许多人在利用Sora的热度疯狂拉人头,积攒私域流量。
例如在朋友圈散发二维码拉人入群,热衷宣扬“Sora首部AI电影共创剧本海选开始!”以及“我们都有机会成为第一代AI导演!”等言论。也有像地推人员一样在AI群中通过私信加好友,以“改变命运”、“破圈”为噱头,索要999元入群,声称共同踏上新世界之门。
更谨慎的则会借着Sora的理由,夸大作用将其吹捧成改变命运、实现财富自由的机会,以此为理由推销《短视频矩阵引流解决方案》等相关课程,声称只有先学好这些,才能成为第一批通过Sora赚钱的人。
归根结底,Sora带来的AI割韭菜事件,和用小礼品吸引大妈买保健品一样,本质上就是割韭菜,贩卖焦虑赚信息差的钱。
真实视频假冒Sora制作,已成流量密码
除此之外,给真实视频标注“该作品由人工智能Sora生成”,也成了当下的流量密码。
事情的起因还得从Sora公布当天说起,X上有一位博主发布了一段由Sora生成的维多利亚凤冠鸠视频,注明了产生它的指令。同时在开头强调了这样一句话:该视频由OpenAI的新模型Sora生成。
视频不出意外得到数千转发,登上了热门,一瞬便激起了广泛的讨论。
随后就有不少网友发现,网上除了Sora公开的一小部分影片作品,突然多了许多标注“该视频由OpenAI的新模型Sora生成”的视频,甚至发布者还贴心地附上了“生成指令”。
然而实际上,这些视频几乎都是用真实视频假冒的Sora视频,并非Sora生成。
比如最近,号称“视频生成界的图灵测试”的威尔·史密斯吃意大利面的视频又重出江湖。视频画面上半段显示是一年以前的 AI 视频,下半段则显示现在的 AI 视频。
要知道,一年前由AI生成的“威尔·史密斯吃意大利面”视频效果并不理想,其中涉及到处理人物手势、面条形状以及进食动作等方面都面临着巨大挑战。相较之下,据称由Sora生成的视频效果却出奇地出色,生成的手势和面条都表现得非常逼真,似乎已经成功应对了图灵测试。
结合最近OpenAI展示的各种Sora生成结果,很多人开始相信:这是Sora生成的新视频,显示出现代视频生成AI已经达到了以假乱真的水平。
然而,实际情况却是该视频并非由Sora生成,而是由威尔·史密斯本人亲自录制。那Sora究竟能不能生成吃意大利面的场景呢?这个问题目前还没有测试结果。
有网友调侃,现在怎么分辨真的真视频,假的真视频,真的假视频,假的假视频,是一大难题。很显然,视频界的混淆矩阵已经出来了。
关于这个问题,也引起了很多专业人士的热议。Keras之父François Chollet就表示,像Sora这样的视频生成模型确实嵌入了物理模型,但问题是:这个物理模型是否准确?它能否泛化到新的情况,即那些不仅仅是训练数据插值的情形?
简单来说,就是François Chollet认为,Sora只达到了人类做梦的水平,但是逻辑能力依然不行。从Sora官方公布的视频中,也可以观察到一些逻辑错误,进一步证实了这个问题。
未来,Sora距离真正“以假乱真”还有一段很长的路要走。