灼见

【灼见】AI是双面刃/周若鹏

那家推出ChatGPT震惊世界的公司OpenAI又再让大家震惊了,这回是Sora,一个可依文字输入创作视频的人工智能系统。

我无法具体解释这科技多么繁复,电脑要明白指令之余,还要明白物件之间的空间关系,掌握光影,那还不是最难的,还有物理关系,比如人踢球,球该飞什么方向?多高多远?碰到墙壁是反弹还是把它撞倒?

这技术不新,一年前已经发布过了,当时AI制作的视频惨不忍睹,但短短一年后作品已几可乱真。进步之快,我也无法具体表达我的赞叹,但同时我也在思考它对社会的冲击。首先要担心的,是AI的确会取代影像工作者的部分工作,首当其冲的行业是视频素材库。

影视业也会“沦陷”

尽管目前AI生成的视频不完美,但用在过场等非关键画面是可行的。以前这类场景可从视频素材库取用,这么做优点是方便快捷,缺点是素材并不独特,他人的作品中也会出现相同片段,AI就解决了这问题,如果AI可根据指令生成独有片段,谁还要用素材库?如此提供素材的影像工作者也会失去权利金的收入。如果用AI就能生成视频片段,又何须花钱聘用摄像团队?

这个冲击不会马上感受到,视频AI还不完善,比较恰当的用途是辅助影像工作者,减少工序,提高利润。但以发展速度来看,迟早会发展到完全无需摄像师介入,普通用户就能制作出所要的视频。

到那个时候连影视业也会“沦陷”,试想如果输入剧本就能产生影像,还需要演员、灯光、场务、茶水、音乐、音效、特效吗?还需要“拍戏”吗?视频AI加上换脸技术(Deepfake),甚至可在电影完成以后才决定演员的脸。

用以诈骗或勒索

诈骗恐怕会更猖獗了。这早已是“有图没真相”的年代,这年头不只连视频不能信,连视讯也不能轻信。本月香港某国际公司被骗了2亿港元,骗徒用该公司首席财务官的脸,通过视讯指示职员转账。

你的社交圈当中可有一些特喜欢分享马哈迪讲日语、习近平讲英语、李显龙卖保险的人?他们盲目相信视频,特别好骗。那些还只是相对静态的演说视频罢了,用常识便可识别真伪。且想象一下骗徒用AI生成亲人被绑的视频,或者干不法勾当的视频,用以诈骗或勒索,将有更多人会遭殃。另外,视频还能当呈堂证物吗?

以上可能延申的社会问题,谷歌、OpenAI必然早就想到,也会把关,但科技流传民间是迟早的事。生成视频需大量电脑资源,掌控在科技巨头手中,但歹徒能先利用科技巨头生成视频 ,再用自家电脑换脸。比如说我指示Sora生产男人携伴游巴黎的视频,然后把男人的脸换成你,你不付钱给我,我就传给你老婆。

总之,魔是肯定高一丈的。我不抗拒视频AI,它是必然的演进,无疑会提高工作效率。只希望大家提高警惕,电脑越来越厉害,拿起手机的时候,别把人脑关掉就行了。

反应

 

在商言商

生成式AI——从文字、图像到视频/孙德俊

作者:孙德俊(Antsomi联合创办人)

2024年2月15日,当全世界的华人还沉浸在农历新年的庆祝氛围时,OpenAI 在西方情人节的隔一天,宣布了其从文字生成视频的新人工智能模型:Sora。

简单来说,通过Sora,我们可以通过文字指令中创建视频,并且呈现出逼真和富有想象力的场景。

自从OpenAI 于2022年11月30日推出ChatGPT 以来,世界就因为生成式AI的应用,而产生了巨大的转变,2023年的发展是在文字和图像的生成上,而2024年我们将会进入生成式AI的视频之年。

当然,在OpenAI宣布Sora之前,已经有一些新创公司推出类似的产品了,这包括Pika 和Runway。但是,今天的OpenAI已经是人工智能圈的“科技大厂”了,只要它一出手,就是行业的标杆。

例子之一是在Sora 网页(https://openai.com/sora)里呈现的女子走在东京街头的视频,其水准就专业的非常惊人,说真的,它看起来就像是由一支专业的制作团队制作出来的视频一样。

事实上,你只需要向OpenAI这个新的人工智能模型,输入以下文字(原文为英文),Sora就能生成这个视频了:“一个时尚的女人,走在满佈霓虹彩灯和城市标牌的东京街道上。她穿着一件黑色皮夹克、一件红色长裙和黑色靴子,还带着一个黑色包包。她戴着墨镜,涂着红色口红。她自信而随意地走路。潮湿且反光的街道,创造了五颜六色的灯光的镜面效果。街道上有许多行人走来走去。”

试想想——传统上,如果你要制作具有这样专业水准的视频,你需要组建一支怎么样的团队前往东京拍摄呢?你需要花费多少钱呢?效果是不是能达到这样的水准呢?

颠覆内容与娱乐业

这就是Sora 在未来会带来的颠覆性影响。很明显的,这不会只是昙花一现的科技新闻,它会是颠覆内容和娱乐产业的一个划时代的发展。

Sora 现在还在内部和早期测试阶段,当它正式推出并开放给大众使用之后,会发生的以下三项影响:

1.生成式AI新战场:

ChatGPT 推出之后,生成式AI 进入文字的战场,另一边厢,Midjourney 也在生成式AI 图像圈称霸。Sora 推出的前后,会开展出另一个生成式AI战场,也就是生成式AI视频工具的争霸战。

这些工具之中,哪家会生成更有质感、更有想象力、更具原创性的视频内容,谁就可以成为赢家。

当然,此工具也要能够和现有的流行软件紧密结合,才会有更广大的覆盖网络,从这个角度来看,OpenAI 和微软(拥有Microsoft Office的广大用户)的紧密关系,绝对让它拥有某一程度上的的优势。

2.颠覆娱乐和创意领域:

多年来,娱乐和创意领域都已发展出既定的制作程序和工作流程。生成式AI 视频的发展,会颠覆这个领域的方方面面,尤其是制作成本的优化。

如何把现有制作环境的优势和新技术紧密结合,制作更多更具有创意的作品,并且通过技术的使用和整合达到成本的优化,才是致胜的关键。

3.每个人都可以是“video producer”,视频将无所不在:

如今自媒体的蓬勃发展,是20年以来 Web 2.0 的结晶。虽然今天的自媒体圈已经充斥了许多视频内容,但是视频制作还是有一定的门槛。生成式AI 视频会让每一个人都可以成为“video producer”,因此视频将会无所不在。

除了自媒体会有更多的视频内容之外,非媒体的专业和工作的内容呈现,也将会附带更多的视频内容,例如简报工作,在未来肯定会包括更多生成式AI视频在里头,来帮助呈现简报者的概念。

不缺工具只缺想象力

另外,生成式AI 视频也会给予现有的YouTubers 更多方便,让他们可以在其视频加入更多之前他们无法制作岀来的影像。

Sora 的命名来自日语里的“天空”,意指”无限的创意可能”。

Sora能够为人类的创意产业带来多么强大的“破坏性创新”?唯一肯定的答案,只有“无限的可能”,因为 the sky is the limit。

AI正带领我们进入一个新的时代,这个新的时代不缺工具,只缺想象力。

反应
 
 

相关新闻

南洋地产