AI Infra新星:硅基流动如何抓住DeepSeek的机遇?
文|邓咏仪
编辑|苏建勋
谁能料到DeepSeek会如此火爆?至少在DeepSeek-V3发布前,为大模型提供算力服务的硅基流动创始人袁进辉,心里也没底。
1月28日,袁进辉在社交媒体分享了一个故事:DeepSeek爆火前一个月,有人建议硅基流动部署DeepSeek-V3,建议准备至少20台H800,最好是80台。袁进辉算了笔账,80台H800服务器,一个月就要支出五六百万的算力成本,而且不确定是否能充分利用。“风险太大,没敢All in。”
结果DeepSeek一炮而红,流量如潮水般涌来,官网和App瞬间崩溃,用户迫切寻找可用渠道。袁进辉感慨:“DeepSeek现在这么火,当初的决策失误,真是后悔莫及。”
懊悔很快转化为行动。面对算力瓶颈,硅基流动迅速与华为合作,全力以赴完成DeepSeek-R1 & V3在昇腾芯片上的适配。整个春节假期,硅基流动团队都在加班加点。
他们的速度很快,成功承接住了第一波流量。2月1日,硅基流动率先推出了基于华为昇腾算力的满血版DeepSeek-R1 & V3,迅速吸引了大量开发者和个人用户。
这是一次精妙的合作,一举打破了市场对国产芯片性能的质疑,证明了在国产芯片上部署DeepSeek,也能达到与高端GPU部署模型相媲美的效果。同时,这次合作也意外地引发了一场国产替代的浪潮。
硅基流动也借此机会展示了其强大的AI Infra实力。“尤其是这次上线DeepSeek R1 & V3之后,合作机会纷至沓来,甚至有些应接不暇。”袁进辉表示。
就在硅基流动声名鹊起之前, 据《智能涌现》报道,硅基流动(SiliconFlow) 在2024年底 完成了亿元人民币Pre-A轮融资,由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投,华兴资本担任独家财务顾问 。
值得关注的是,本轮融资之前,硅基流动已经引入美团作为战略股东。
2024年8月,《智能涌现》曾采访过创始人袁进辉,当时硅基流动成立一周年,并发布了MaaS平台SiliconCloud。
可以将SiliconCloud看作一个“大模型API超市”,开发者只需注册账号,选择所需的模型,即可开发应用,无需承担购买服务器的成本。经过硅基流动适配和优化的模型,甚至能实现比原厂模型更快的响应速度和更低的推理成本。
过去一年,硅基流动经历了至少十倍的市场增长。SiliconCloud已经拥有超过三百万用户,日均调用量超过千亿Token——去年刚上线时,这个数字还是日均百亿。
在开发者圈内,硅基流动口碑良好,以亲民的价格和卓越的性能,被誉为“赛博菩萨”。目前,SiliconCloud已经上线了包括满血版DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice等在内的数百款主流模型,并提供模型训练、微调、托管到部署的全套工具,满足开发者和企业客户的不同需求。
2024年7月,硅基流动还推出了一款新产品:基于ComfyUI的云节点插件BizyAir。
BizyAir是一款图像生成工具,使AI开发者和创作者无需考虑显卡和环境限制,即可直接利用云计算资源完成图像生成任务。目前,BizyAir支持数十种模型,支持ComfyUI本地节点混合运行,已拥有近万名用户。
在过去的一年里,硅基流动也开始了To B商业化拓展,与华为、亚马逊云科技、英伟达等顶级云厂商、芯片厂商、大模型公司和应用公司建立了合作关系。
在企业服务方面,硅基流动已经在大型语言模型、文本生成图像、视频生成等多个领域,实现了标杆客户案例的落地。硅基流动目前提供四种服务模式,包括专属实例、算力托管、私有版MaaS、基于华为昇腾910系列NPU的一体机。
毫无疑问,DeepSeek的出现扫除了2024年大模型领域的阴霾,一场宏伟征程的序幕已经拉开。2024年,袁进辉曾对《智能涌现》表示,GPT-4o发布后,大模型的语言能力和知识能力已经得到了较好的解决,唯独逻辑推理能力还有待提升。
OpenAI o1和DeepSeek R1的出现,标志着大模型在“逻辑能力”方面取得了重大进展,这对应用市场来说是巨大的利好。
“可以预见,国内外基于DeepSeek的应用将会爆发,这一天终于要到来了。”袁进辉说。
对话创始人:硅基流动的下一步
以下为《智能涌现》与创始人袁进辉的问答:
《智能涌现》 :上一轮融资之后,硅基流动在产品方面有什么里程碑式的进展?关键性能提升了多少?
袁进辉 :主要体现在适配了华为昇腾芯片、开源了ComfyUI云节点BizyAir,以及持续上线最新模型,并且增加了模型微调、托管等功能。
底层推理框架的性能仍然保持行业领先水平,性能优化是一项需要长期持续投入的工作。
《智能涌现》 :推出这些产品后,市场反响如何?商业落地方面有什么关键进展?
袁进辉 :SiliconCloud获得了爆发式增长,目前平台拥有超过三百万用户,日均调用量超过千亿Token;BizyAir在几乎没有推广的情况下也获得了近万名用户。
在商业落地方面,尤其是在这次上线DeepSeek R1 & V3之后,合作邀约源源不断。
《智能涌现》 :去年7月,硅基流动上线了BizyAir,推出这款产品的初衷是什么?战略定位是什么?
袁进辉 :BizyAir是一个意外的惊喜。最初,这只是一个实验性项目,旨在帮助用户以更高的性价比使用推理服务资源,更便捷地进行图像生成。在此之前,我们开源的图片/视频生成推理加速组件OneDiff,凭借其良好的性能、灵活性和丰富的模型支持,已经获得了良好的口碑。在开发OneDiff的过程中,我们了解到生图用户的常见痛点,例如出图速度慢、工作流程组合复杂、上手门槛高等,因此我们尝试开发了BizyAir,发布后受到了用户的喜爱和自发传播。
《智能涌现》 :去年您提到,大模型的语言能力和知识能力已经得到了较好的解决,但逻辑能力还有待提升。在Deepseek V3之后,逻辑能力是否已经足够强大?2025年是否会迎来现象级的应用爆发?
袁进辉 :那时还没有OpenAI o1和DeepSeek-R1。它们的发布已经展示了模型强大的逻辑推理能力,特别是DeepSeek-R1将思考过程完整地展现了出来,看起来更像是一个具有思辨能力的人在思考。
现在,开发者基于标准API可以开发出许多酷炫的应用,可以预见,国内外基于DeepSeek等开源模型的应用将会迎来爆发,这一天已经越来越近了。
《智能涌现》 :最近硅基流动迅速基于昇腾上线了DeepSeek,春节期间也有大量开发者涌入,你们在前线观察到的情况是怎样的?
袁进辉 :我原本以为我们能够承接住这波用户,但市场对DeepSeek-R1 & V3的需求量实在太大了,目前不得不对免费用户进行限流。当然,我们也在积极扩展资源,希望能让用户能够畅快使用。
作为一个面向开发者和企业客户的API平台,仅官网的Playground就有数十万日活用户,可见DeepSeek的需求之旺盛。
《智能涌现》 :许多第三方企业都宣布接入了DeepSeek-R1 & V3,但为什么真正能够提供满血版DeepSeek的企业却很少?
袁进辉 :一方面,部署满血版DeepSeek R1 & V3需要的算力资源非常巨大,用80台H800来部署,每月需要五六百万的算力成本,对于一般企业而言,接入硅基流动SiliconCloud这样的云服务API显然更具性价比;
另一方面,部署DeepSeek R1 & V3这样的MoE模型,在技术上极具挑战性,需要专业的AI Infra团队才能成功部署并实现良好的性能优化。硅基流动SiliconCloud是国内最早部署上线DeepSeek模型的第三方平台之一,也是首个在国产芯片上适配部署DeepSeek-R1 & V3的AI Infra公司。
硅基流动(SiliconFlow):AI人工智能云服务平台:【点击登陆】
SiliconFlow(硅基流动):AI计算基础设施平台:【点击登陆】