名家专栏

DeepSeek让AI行业失去价值?/奕帆丰顺

在中国初创公司DeepSeek引起关于美国在人工智能(AI)领域竞争力和领导地位的担忧后,美国科技公司股价出现显著下跌。

在去年十二月底,DeepSeek通过推出一个免费、开源的大型语言模型(DeepSeek V3)引起了市场轰动。据报道,该模型仅在两个月内开发完成,成本不到600万美元(约2640万令吉)。

最新的开源DeepSeek R1在强化学习阶段之前,使用了多阶段训练和冷启动数据,在全球技术领域引起了轩然大波。

成本更低

简单来说,DeepSeek R1声称能够以更低的训练成本击败其他聊天机器人,比如OpenAI的ChatGPT或Meta的LLAMA。这一进展引发关于大型科技公司是否在人工智能模型和数据中心上投入巨资的激烈讨论。

DeepSeek展示了通过算法和架构改进,可以使用较旧款的GPU以明显更低的成本实现类似的结果。

这对人工智能资本支出快速扩张的合理性构成了挑战,甚至可能比近期围绕“规模定律”(Scaling Law)瓶颈相关争论更为严峻。

规模定律瓶颈争议主要指出,在预训练阶段增加更多GPU的边际回报正在减少,但这在短期内难以验证,且很容易被反驳。

例如,规模定律在微调(fine-tuning)阶段仍然适用,Meta和Grok等公司目前正在使用10万个GPU预训练大型模型。

不过,在资源受限下,DeepSeek此次确实取得成果。

鉴于之前的规模定律瓶颈争议,加上关于ASIC(专用集成电路)与通用GPU(图形处理单元)的讨论持续了一个多月(从11月14日至12月20日),DeepSeek所引发的质疑不会在短短几天内就消散。

话虽如此,投资者正在关注大型科技公司的财报,这些公司如何克服这一问题将至关重要。尽管GPU需求可能会有所放缓(相较于过去一年飙升的增长),但我们认为未来增长潜力仍然巨大,投资者应继续看好该领域。

效率提升刺激需求

我们认为此次市场回调,主要是由近期反弹后的避险行为所引发,尤其如今正值大型科技股的财报季,同时还受到美联储最新的货币政策路径影响。

投资者的关注点集中在这点——如果成本/模型计算效率显著提高,市场对人工智能资本支出和计算需求的预期是否会出现短期错配。

我们认为开源模型可能会通过提高推理效率,最终推动AI在边缘计算等领域的更广泛应用,进而颠覆行业格局。

随着开发者能够更轻松地获取强大的AI模型,而无需支付昂贵的许可费用,我们预计这可能将加速人工智能在更广泛的设备和应用中的整合。

这可能会为医疗、制造业和智慧城市等行业的人工智能驱动解决方案创造新的机会,尤其是在本地设备实时处理需求日益增长的情况下。然而,我们并不认为DeepSeek的推出会彻底改变行业并降低高端GPU的需求。

DeepSeek训练的推理成本不包括数据抓取和训练成本,因此无法与OpenAI从零开始、耗资数亿美元训练模型的成本进行直接对比。

随着DeepSeek推出,行业参与者再次站在同一起跑线上,预计将有更多的训练和推理过程,以抢占先发市场份额,进而支撑GPU需求。

大型科企收益更多

DeepSeek已经展示了可以更高效、更低成本地训练模型,我们相信大型科技公司将通过整合DeepSeek的创新技术,如专家混合(Mixture-of-Experts)架构来优化自身模型。

据报道,Meta已组建了工程师团队,以评估如何重新配置公司的人工智能Llama,从而能够采用DeepSeek性价比更高的训练和推理方法。

通过采用这一成本效益高的技术,大型科技公司也将能够从其人工智能资本支出中获得更多收益,从而转化为更高的利润率和投资回报率。

此外,计算成本的降低并不意味着大型科技公司会减少在人工智能资本支出上的投入。相反,它们可能会利用对高端芯片的掌握,并将其与DeepSeek的技术相结合,从而扩大美国与中国AI科技之间的差距。

DeepSeek的崛起,可能会迫使像OpenAI和Alphabet等公司降低其大模型订阅的价格。然而,价格降低也可能带来更高的收入,因为较低价格会被消费者和企业更广泛的采用所抵消。

全新开始并非终结

在日本低油耗汽车占据北美市场的一半份额后,北美家庭的原油消费量不降反升。同样,当小米将智能手机价格由5000元降至1999元时,供应链公司的利润也显著增长。DeepSeek可以理解为一种“民主化”——更多的参与者加入了这个领域。

在互联网泡沫时代,市场对“互联网”产品的兴趣和使用量急剧上升。这一新兴数码领域的热潮不仅没有因高估值担忧而让人却步,反而激发了更多个人和企业进入互联网行业。

互联网科技的广泛采用和探索创造了一个创新蓬勃发展的生态系统,后续出现的搜索引擎、电子商务和社交网络等,塑造了我们今天所熟知的现代互联网。

这是一种自我强化的循环:繁荣吸引了人才、投资和雄心,推动了领域的加速发展,即使在泡沫破裂后仍未止步。就像互联网的“民主化”一样,进入门槛被降低,参与者增多,推动了各个行业的发展,甚至超越了之前的高峰。

英伟达霸主地位稳固

GPU市场正在经历结构调整,但英伟达的主导地位仍然稳固。DeepSeek的科技创新可能会减少部分训练对GPU的需求,但持续的人工智能军备竞赛和对通用人工智能(AGI)的追求仍然高度依赖于超级计算集群。

英伟达在高性能计算方面表现出色,其强大的CUDA生态系统仍是其核心优势。与此同时,DeepSeek的开源策略可能会吸引开发者,但英伟达可以通过战略合作来维持其影响力,例如支持混合精度训练框架等。

投资者不应对最新动态过度解读。我们鼓励投资者将此视为在颠覆性浪潮中寻找投资机遇的良好时机。

视频推荐 :

 

 
 

 

反应

 

亚洲周刊专区

中国科企从尘埃里开出花/邱立本

作者:邱立本

张一鸣和梁文锋都是小镇青年出身,在低调中暗藏终身学习的动力,如张爱玲笔下“从尘埃里开出花来”,不甘于科技被西方卡脖子,用创新来改变自己和国家的命运。

利润极大化,长期以来是全球企业家的信条。尤其是上市公司,总执行长都要对股东负责,要确保股东的利益。

不过,中国越来越多新的企业家拥有更高维度的思考,不着眼于短期财报,超越股东权益的考虑,而要从国家利益、甚至全人类的情怀来考虑,瞄准长期策略,开创企业更宽广的视野。

张一鸣、梁文锋等80后,都有这样的抱负。

他们都不在乎利润极大化的概念与实践,而是要持续创新,更要保持团队的高昂士气,并且在管理上采取扁平化的组织,消除官僚化,重视技术推动,融合硅谷的极客文化和中国特有的狼性文化,展现中国新一代总执行长的智慧身影。

张一鸣的字节跳动在8年内就跃升至每日全球逾10亿流量,是唯一在中国和西方世界都是流量名列前茅的科企。他在2017年推出抖音国际版TikTok,名震天下,以独特的算法拿捏全球20亿用户,引起各国政府强烈反应。

从拜登到特朗普,都威胁要禁它,但是面对很多年轻一代的强烈抗议,都要高高举起、轻轻放下。他不像马云那样的社交狂热,也没有刘强东的奶茶妹妹妻子的八卦,他是低调到像张爱玲笔下的“变得很低很低,低到尘埃里” ,但是就在技术和人文的情怀里,却“从尘埃里开出花来”。

不过,张一鸣的花却从海外香到国内。他是第一个中国科企在国际上拥有如此强大的声浪,不仅是在美国的1.7亿用户,还有在东南亚也是风靡一时,成为青少年的恩物,印尼2.3亿人口,有近2亿用户,并且连接电商,成为拉满价值链的社交媒体。

不寻求西方资金

梁文锋也是不求闻达的技术宅男,甚至刻意不去寻求西方的资金,核心团队几乎都不是海归,而是本土成长的精英。在美国和西方对中国封锁下,在孟晚舟事件的历史教训中,他甚至不让内部同事出国,以免莫名其妙地“自杀’或“失踪”。他的“深度求索”(DeepSeek)的亮点就是“文青范”,无论是中文还是英文,写小说、散文还是诗歌,都是文采斐然,令人惊叹,胜过其他智能大模型,背后就是对修辞的敏锐,对文学的激情。

张一鸣和梁文锋都是小镇青年,没有显赫家世,不是红二代或官二代,而是普通人家。但他们都有一股终身学习的动力,不甘于平庸,不甘于科技被西方卡着脖子,都用创新来改变自己和国家的命运。

张一鸣是福建省龙岩人,他命名的TikTok其实就是闽南话的“游戏”的意思,让台湾和东南亚的闽南话人口觉得特别亲切。梁文锋是广东省湛江人,可以说粤语,但他们两位的普通话都很标准,几乎没有方言的口音,展示中国推普运动的成功。

不过,他们最重要的语言还是创新的语言,不断精进,在国际竞争的舞台上,展现中国新一代企业家的魅力。

新闻来源:亚洲周刊

反应
 
 

相关新闻

亚亦君令补选
南洋地产
BESbswyBESbswyBESbswyBESbswyBESbswyBESbswy