【灼见】AI是双面刃/周若鹏

2024年02月25日

那家推出ChatGPT震惊世界的公司OpenAI又再让大家震惊了，这回是Sora，一个可依文字输入创作视频的人工智能系统。

我无法具体解释这科技多么繁复，电脑要明白指令之余，还要明白物件之间的空间关系，掌握光影，那还不是最难的，还有物理关系，比如人踢球，球该飞什么方向？多高多远？碰到墙壁是反弹还是把它撞倒？

这技术不新，一年前已经发布过了，当时AI制作的视频惨不忍睹，但短短一年后作品已几可乱真。进步之快，我也无法具体表达我的赞叹，但同时我也在思考它对社会的冲击。首先要担心的，是AI的确会取代影像工作者的部分工作，首当其冲的行业是视频素材库。

影视业也会“沦陷”

尽管目前AI生成的视频不完美，但用在过场等非关键画面是可行的。以前这类场景可从视频素材库取用，这么做优点是方便快捷，缺点是素材并不独特，他人的作品中也会出现相同片段，AI就解决了这问题，如果AI可根据指令生成独有片段，谁还要用素材库？如此提供素材的影像工作者也会失去权利金的收入。如果用AI就能生成视频片段，又何须花钱聘用摄像团队？

这个冲击不会马上感受到，视频AI还不完善，比较恰当的用途是辅助影像工作者，减少工序，提高利润。但以发展速度来看，迟早会发展到完全无需摄像师介入，普通用户就能制作出所要的视频。

到那个时候连影视业也会“沦陷”，试想如果输入剧本就能产生影像，还需要演员、灯光、场务、茶水、音乐、音效、特效吗？还需要“拍戏”吗？视频AI加上换脸技术（Deepfake），甚至可在电影完成以后才决定演员的脸。

用以诈骗或勒索

诈骗恐怕会更猖獗了。这早已是“有图没真相”的年代，这年头不只连视频不能信，连视讯也不能轻信。本月香港某国际公司被骗了2亿港元，骗徒用该公司首席财务官的脸，通过视讯指示职员转账。

你的社交圈当中可有一些特喜欢分享马哈迪讲日语、习近平讲英语、李显龙卖保险的人？他们盲目相信视频，特别好骗。那些还只是相对静态的演说视频罢了，用常识便可识别真伪。且想象一下骗徒用AI生成亲人被绑的视频，或者干不法勾当的视频，用以诈骗或勒索，将有更多人会遭殃。另外，视频还能当呈堂证物吗？

以上可能延申的社会问题，谷歌、OpenAI必然早就想到，也会把关，但科技流传民间是迟早的事。生成视频需大量电脑资源，掌控在科技巨头手中，但歹徒能先利用科技巨头生成视频，再用自家电脑换脸。比如说我指示Sora生产男人携伴游巴黎的视频，然后把男人的脸换成你，你不付钱给我，我就传给你老婆。

总之，魔是肯定高一丈的。我不抗拒视频AI，它是必然的演进，无疑会提高工作效率。只希望大家提高警惕，电脑越来越厉害，拿起手机的时候，别把人脑关掉就行了。

Sora

人工智能

AI

诈骗

周若鹏

言论 |人生顶肺

周若鹏

言论 |人生顶肺

在商言商

生成式AI——从文字、图像到视频/孙德俊

2024年02月21日

孙德俊

作者：孙德俊（Antsomi联合创办人）

2024年2月15日，当全世界的华人还沉浸在农历新年的庆祝氛围时，OpenAI 在西方情人节的隔一天，宣布了其从文字生成视频的新人工智能模型：Sora。

简单来说，通过Sora，我们可以通过文字指令中创建视频，并且呈现出逼真和富有想象力的场景。

自从OpenAI 于2022年11月30日推出ChatGPT 以来，世界就因为生成式AI的应用，而产生了巨大的转变，2023年的发展是在文字和图像的生成上，而2024年我们将会进入生成式AI的视频之年。

当然，在OpenAI宣布Sora之前，已经有一些新创公司推出类似的产品了，这包括Pika 和Runway。但是，今天的OpenAI已经是人工智能圈的“科技大厂”了，只要它一出手，就是行业的标杆。

例子之一是在Sora 网页（https://openai.com/sora）里呈现的女子走在东京街头的视频，其水准就专业的非常惊人，说真的，它看起来就像是由一支专业的制作团队制作出来的视频一样。

事实上，你只需要向OpenAI这个新的人工智能模型，输入以下文字（原文为英文），Sora就能生成这个视频了：“一个时尚的女人，走在满佈霓虹彩灯和城市标牌的东京街道上。她穿着一件黑色皮夹克、一件红色长裙和黑色靴子，还带着一个黑色包包。她戴着墨镜，涂着红色口红。她自信而随意地走路。潮湿且反光的街道，创造了五颜六色的灯光的镜面效果。街道上有许多行人走来走去。”

试想想——传统上，如果你要制作具有这样专业水准的视频，你需要组建一支怎么样的团队前往东京拍摄呢？你需要花费多少钱呢？效果是不是能达到这样的水准呢？

颠覆内容与娱乐业

这就是Sora 在未来会带来的颠覆性影响。很明显的，这不会只是昙花一现的科技新闻，它会是颠覆内容和娱乐产业的一个划时代的发展。

Sora 现在还在内部和早期测试阶段，当它正式推出并开放给大众使用之后，会发生的以下三项影响：

1.生成式AI新战场：

ChatGPT 推出之后，生成式AI 进入文字的战场，另一边厢，Midjourney 也在生成式AI 图像圈称霸。Sora 推出的前后，会开展出另一个生成式AI战场，也就是生成式AI视频工具的争霸战。

这些工具之中，哪家会生成更有质感、更有想象力、更具原创性的视频内容，谁就可以成为赢家。

当然，此工具也要能够和现有的流行软件紧密结合，才会有更广大的覆盖网络，从这个角度来看，OpenAI 和微软（拥有Microsoft Office的广大用户）的紧密关系，绝对让它拥有某一程度上的的优势。

2.颠覆娱乐和创意领域：

多年来，娱乐和创意领域都已发展出既定的制作程序和工作流程。生成式AI 视频的发展，会颠覆这个领域的方方面面，尤其是制作成本的优化。

如何把现有制作环境的优势和新技术紧密结合，制作更多更具有创意的作品，并且通过技术的使用和整合达到成本的优化，才是致胜的关键。

3.每个人都可以是“video producer”，视频将无所不在：