AI浪潮下的领航者:NVIDIA的崛起与战略投资
人工智能的爆发式增长,让OpenAI等企业声名鹊起,但真正的幕后赢家非NVIDIA莫属。这家公司凭借其强大的GPU算力,成为AI大模型训练和推理的关键支撑,市值甚至一度超越微软,跃居全球第二。NVIDIA的财报数据印证了这一点,2024年第三财季营收高达350.82亿美元,同比激增93.61%,净利润更是增长108.90%至193.09亿美元,其中数据中心业务收入达308亿美元,同比增长112%。
AI企业与NVIDIA的合作可谓相辅相成,前者对GPU的巨大需求,成就了NVIDIA的辉煌。而NVIDIA也深谙“扶持客户,培养市场”之道,2024年累计投资超过10亿美元于50多家AI初创企业,较2023年增长约15%。预计在2025年,NVIDIA还将加大对AI领域的投资力度。
除了NVIDIA,国内外各大互联网公司也在积极布局AI,一方面组建自身AI团队,另一方面投资有潜力的AI企业。2024年,AI领域涌入大量新企业,天眼查数据显示,国内新增AI相关企业超过50万家。然而,AI技术日趋成熟的今天,新入局者真的还有机会吗?
AI创业:资金、人才、数据的三重挑战
AI大模型的黑盒特性,使得其可解释性和可调试性较弱,开发者面临语义理解、数学逻辑、推理能力以及“幻觉”等技术难题。为了训练一个成熟可用的AI大模型,需要投入大量资金,招募顶尖技术人才。然而,行业竞争激烈,人才争夺导致AI人才成本不断飙升,甚至出现“天价年薪”的情况。例如,小米为了挖角参与过DeepSeek-V2大模型开发的罗福莉,据传开出了千万年薪。
除了人才,GPU算力也成为AI公司沉重的负担。小米正在构建万卡算力集群,而一个1.6万张GPU的集群,采购成本就高达数十亿元,运营维护成本更是天文数字。OpenAI CEO山姆·奥特曼甚至提出7万亿美元重塑全球半导体行业的计划,以满足未来AI大模型的算力需求。算力投入堪称无底洞,未来需要多少算力,没有一家AI公司能给出准确答案。更糟糕的是,用于训练大模型的数据也面临匮乏。
GPT-5至今未能完成训练,主要原因就是数据不足。为解决数据难题,OpenAI不得不招聘工程师、数学家、物理学家来编写数据。为了训练GPT-4和GPT-5,OpenAI几乎耗尽了网上公开的数据,甚至因此惹上官司。山姆·奥特曼表示,未来训练一个大模型的成本可能会超过10亿美元。
人才、算力、数据三大成本让AI公司倍感压力,特别是初创企业。但DeepSeek-V3的出现,或许能给行业带来新的希望。
DeepSeek的低成本突围:降本增效的新思路
DeepSeek-V3的出现,让AI行业看到了低成本训练大模型的可能性。其训练成本仅为557.6万美元,远低于GPT-4,甚至不到GPT-5的二百分之一。DeepSeek-V3在文字生成、数学推理等领域的表现,不输国内主流AI应用。
DeepSeek之所以能以如此低的成本训练出高性能的大模型,主要得益于以下几点:MLA架构和MoE架构的使用,有效减少计算量和降低对计算资源的需求;FP8混合精度训练框架,以牺牲精度为代价,大幅节省了显存和计算资源;模型蒸馏技术,通过“教师模型”指导“学生模型”学习,降低训练成本。但这些技术在降低成本的同时,也存在一些不足,特别是模型蒸馏存在“学生模型”能力无法超越“教师模型”的缺陷,并且可能出现数据偏差和侵权问题。
尽管如此,DeepSeek-V3的成功仍然为其他AI公司指明了一条道路,即通过降低精度、压缩内容、蒸馏模型,可以以较低成本打造出表现出色的AI大模型。
AI行业:机遇与挑战并存,适合“野心家”
AI行业正处于快速发展向成熟过渡的关键阶段,任何企业都有机会成为行业巨头。但与新能源汽车行业类似,未来AI行业也会经历大浪淘沙的过程。当前,AI行业依然适合两类企业入场:一类是财力雄厚,致力于引领行业发展的企业;另一类是不追求极致,以“够用就好”为目标,利用低成本技术打造AI模型的企业。苹果和恒驰的失败案例表明,新兴行业充满风险,不是有钱就能成功。但机遇与风险总是并存的,只有做到极致的企业才能在未来赚大钱。
至于那些空有野心却实力不足的企业或创业者,已不适合现在的AI行业。虽然有NVIDIA等巨头的投资,但相对顶级AI大模型的开发成本来说,仍然是杯水车薪。AI行业依然是野心家的乐园,只是门槛更高了,入场需要更加谨慎。