切换到宽版
  • 5阅读
  • 1回复

[数码讨论]460万美元训练!月之暗面万亿参数模型登顶开源榜首,国产模型的又一个DeepSeek时刻 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
201601
金币
533560
道行
2004
原创
2433
奖券
3100
斑龄
39
道券
1137
获奖
0
座驾
设备
摄影级
在线时间: 44696(小时)
注册时间: 2008-10-01
最后登录: 2025-11-11
只看楼主 正序阅读 使用道具 楼主  发表于: 4小时前

图片由AI生成

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

“AI独角兽又重回舞台中心了。”谈及最近国产大模型的表现,有AI从业者感叹。

最新例证是,月之暗面发布的万亿参数思考模型Kimi K2 Thinking,其基本赶超GPT-5等领先的闭源模型,并登顶全球开源模型榜首。

值得注意的是,这款模型还用了很低的成本。搜狐科技获悉,Kimi K2 Thinking模型的训练成本约为460万美元(约合人民币3200万元)。

这刷新了DeepSeek的纪录。DeepSeek曾透露V3模型仅花了560万美元,引发全球AI圈震动,如今Kimi K2 Thinking又降低了百万美元。

“这是中国大模型最接近OpenAI的时刻”、“又一个DeepSeeek时刻”,不少评价称。而除了月之暗面,智谱、MiniMax的模型最近也在海外出圈。

DeepSeek-R2迟迟不来,现在其也似乎已不再是话题中心,曾被抢去风头的国内AI独角兽则开始走向全球舞台,这也是这些公司试图重新抢回技术话语权的尝试。

“又一个DeepSeeek时刻”

万亿参数、开源登顶、赶超GPT-5……这是月之暗面最新发布的思考模型Kimi K2 Thinking被外界讨论的关注点。

官方评测显示,该模型在推理、编程等多个能力超过或接近GPT-5和Claude Sonnet 4.5,并在人类最后的考试(Humanity's Last Exam)等多项基准测试中达到SOTA(最优)水平。

“这是开源模型的历史性突破。”在Artificial Analysis(下称AA)最新发布的全球模型综合评测中,Kimi K2 Thinking得分跃居全球第二,和GPT-5两款模型仅有1分之差。

在该机构发布的智能体评测基准τ2-Bench的电信任务中,Kimi K2 Thinking更是直接跃升至第一名,吊打GPT-5、Claude Sonnet 4.5、Grok4等领先模型。

月之暗面在海外社交平台对这款模型的介绍推文短短几天阅读就超过440万,并再次刷新了海外对中国大模型的认知,有评论认为这又是一个“DeepSeek时刻”。

这款模型用了比DeepSeek更低的成本。搜狐科技从知情人士获悉,Kimi K2 Thinking模型的训练成本约为460万美元。这不仅远低于OpenAI等模型投入,还打破了DeepSeek-V3约560万美元的训练成本纪录。

“相对美国那些顶尖模型来说,这个成本很低。中国多数模型都差不多这个预算水平,很多企业没有那么多芯片可用,所以就是看谁训得好。”有AI从业者表示。

至于Kimi K2 Thinking为何能继续降低成本,月之暗面并未透露相关技术论文,业内认为还是得益于算法、架构、后训练等方面的优化,此次关键的一点是采用了原生INT4量化技术。

INT4是指在大语言模型中的一种量化技术,其通过降低模型参数的数值精度来减少模型的存储需求和计算资源消耗,同时尽可能地保持模型的性能。

月之暗面研究员刘少伟发文透露,在研发K2-Thinking时,发现随着模型的生成长度变得越来越长,想要实现低延迟的推理,必须使用量化损失更小的INT4 QAT(训练感知量化)方案,这也使得后训练强化学习的训练效率显著提升。

至于为何不选择更“先进”的格式,刘少伟称是为了更好地支持非Blackwell架构硬件。“在大模型时代,量化是一个可以跟SOTA和Frontier(边界)放在一起,甚至加快模型达到Frontier速度的概念。”

不过,不少实测显示,Kimi K2 Thinking显得非常“话痨”。在AA的智能指数评测时,它总共使用1.4亿个token,是DeepSeek V3.2的2.5倍,是GPT-5的2倍,导致推理成本和速度受到一定影响。

“现在,世界上最智能的模型是开源的,而且来自中国。如果美国继续闭门造车,中国开源模型将会完全取胜。”有评论说到。

全球华人首富黄仁勋上周提到,中国的AI技术非常出色,并开发出了非常优秀的AI,目前世界上最流行的开源AI模型都来自中国,发展速度非常快。

这话说得没错,目前中国的开源模型无论是能力,还是数量都占据优势,今年的开源榜首也由中国模型轮流做。

在AA全球最新开源模型榜单中,全球前十模型中有六款来自中国,其中Kimi K2 Thinking居首,取代了半月前登顶榜首的MiniMax-M2,以及更早前的阿里、DeepSeek模型。

过去一段时间,以OpenAI为核心的美国科技圈围绕算力基础设施进行捆绑,并挥出上万亿美元的投资,将自身优势发挥到了极致,但这种模式在中国难以复制。

对中国多数大模型厂商来说,需要在算法、架构、工程等层面加大创新突破,正如DeepSeek和Kimi所做的这样。一点一点的微创新累计起来,最终有可能产生惊人的成果。

一个明显的信号是,中国AI独角兽在重回技术竞赛后,正在重回舞台中心。现在,DeepSeek在AA全球模型的排名已至十名之外,或许只有R2会再扳回一局。

国产模型的应用之风吹到了硅谷

在Kimi 模型出圈的背后,中国大模型日益受到海外青睐,硅谷正尝试从昂贵的闭源往更便宜的中国开源模型上迁移。

硅谷知名投资人、Social Capital公司创始人Chamath Palihapitiya近日坦言,已把大量工作负载转移到Kimi K2。

美国云计算公司Vercel则上线了该模型的API服务,AI编程独角兽Cursor和Windsurf,百度前高管景鲲在美创业公司Genspark,以及AI搜索独角兽Perplexity等多家公司均有接入。

MiniMax早前发布的推理模型M2,推出几天后就在海外模型路由器OpenRouter的全球调用量达到前三,一度成为HuggingFace下载量最大的模型,还有至少20家平台提供了API服务。

此外,不少硅谷公司被爆出套壳中国大模型。Cursor在最新2.0版本更新中,推出首个自家的代码模型Composer。但被开发者爆出,Composer套壳了中国的GLM-4.6模型。

GLM- 4.6是智谱在今年9月底发布的旗舰模型,代码能力对齐Claude Sonnet 4,当时号称国内最好的代码模型,随后在大模型竞技场LMArena中排名开源模型第一。

另外两大AI编程独角兽Cognition和Windsurf也被爆出套壳GLM-4.6,Windsurf在被网友扒出后,直接不装了,称应社区用户的热烈呼声,上线了GLM-4.6模型,认为其“将带来更出色的代码生成能力和编程任务表现”。

这也让不少AI从业者感到振奋。“原来都是中国大模型套壳海外领先模型,现在我们的模型成为被套壳的对象,国产模型真正开始扬眉吐气了。”

可以说,中国大模型出海已进入新阶段。从最初仅仅是关注讨论,到部分产品应用出圈,再到多个国产基座模型在海外企业落地,大模型领域的Made in China含金量,正在持续上升。

值得注意的是,这些模型均选择了开源。这让全球开发者和企业能够无负担地应用起来,而中国大模型借助开源正在构建起越来越大的技术影响。

当然,开源也需要实力支撑,而让硅谷选择中国模型的关键就是极致的性价比。

美国云计算公司Vercel CEO吉列尔莫·劳赫(Guillermo Rauch)提到,在内部智能体真实场景基准测试中,Kimi K2在运行速度和准确率上优于GPT-5和Claude Sonnet 4.5,其中准确率更是高出50%。

前述硅谷投资人Chamath则提到,Kimi-K2性能够强,且比OpenAI和Anthropic便宜太多。

数据显示,Kimi-K2、Kimi K2 Thinking以及智谱GLM-4.6的API输出价格约为GPT-5的20%,不到Claude Sonnet 4.5的15%,MiniMax-M2的价格更是仅有Claude Sonnet 4.5的8%。

“这个一个重要时刻,中国的开源模型具备了足够的能力来支持西方产品的开发,全球AI正进入多极化竞争的新格局。”有评论称,甚至有海外网友表示:是不是该学点中文了?

融资上市,AI独角兽各谋出路

技术赶超、出海破圈,中国的AI独角兽试图继续留在牌桌上。这也让它们在迈向上市和新一轮融资的过程中,更有底气了。

月之暗面最近被爆出开启新一轮融资,甚至传出海外知名的a16z考虑投资。有消息称,月之暗面此次融资约6亿美金,投前估值38亿美金,领投方指向IDG,腾讯、五源资本、今日资本等老股东计划跟投。

如融资完成,月之暗面有望成为继智谱、MiniMax后又一家估值超300亿元的AI独角兽。

搜狐科技就此向月之暗面以及有关投资方求证,对方未做回应。有关注AI的投资人认为,这么高额的融资,一般需要比较长的时间决策确认,而美国基金在当前环境下不太可能投。

对月之暗面前述估值,该投资人表示,在国内大模型融资热潮已经过去的情况下,这个估值不算低,但相较美国大模型独角兽来说差距很大。

有观点认为,国内AI独角兽相较美国AI创企,技术和估值严重不匹配。比如,月之暗面估值不到OpenAI和Anthropic的1%,“国内大模型赚钱还是太难了”。

此前两年,月之暗面是大模型市场炙手可热的明星,去年超13亿美元的两轮融资更是让其成为估值达33亿美元的AI独角兽,Kimi也一度成为国内流量最高的AI原生应用。

然而,随着联创张予彤和朱啸虎的纠纷,以及DeepSeek冲击,月之暗面遭遇质疑,公司发展也出现摆动,停止产品投流,重心转向技术,并从闭源走向开源等。

今年以来,Kimi用户规模增长停滞甚至下降。据QuestMobile,今年9月,Kimi月活规模已不足千万,相较去年12月下降超过1100万,在国内AI原生APP排名从第二降至第五。

在商业化方面,月之暗面继续押注C端,此前在海内外上线OK Computer,并首次开启订阅付费。在国内同类型产品均免费,且面临头部竞争情况下,这可能是一场持久的恶战。

在这种情况下,此次融资对月之暗面颇为重要,尤其是在商业化相对较好的智谱开启上市和MiniMax计划上市的情况下,其需要积累更多资金应对未来的变局。

今年中期,MiniMax完成近3亿美元新一轮融资,投后估值超40亿美元,上海国资等出手。随后,该公司被爆计划赴港上市,当时内部人士称确有上市想法。

目前,该公司海外推出的陪伴类应用Talkie和视频生成应用海螺AI构成其主要收入来源,最近还在编程和智能体产品上推出收费模式,进一步押注C端。

深耕G端和B端的智谱则在今年上半年完成多地国资融资,并开启上市,有望在年内提交科创板招股书,成为大模型第一股。此前该公司爆出裁员,亦反应出商业化和上市的不易。

肉眼可见的是,AI四小虎中的阶跃星辰,似乎有些掉队。AI独角兽们在技术理想和现实交织当中仍面临生存压力,但目前还远未到格局已定的局面。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
201601
金币
533560
道行
2004
原创
2433
奖券
3100
斑龄
39
道券
1137
获奖
0
座驾
设备
摄影级
在线时间: 44696(小时)
注册时间: 2008-10-01
最后登录: 2025-11-11
只看该作者 沙发  发表于: 4小时前
中国大模型崛起:技术突破、全球出圈与独角兽的突围之路

---

一、历史性突破:Kimi K2 Thinking 登顶全球,刷新AI成本极限

月之暗面发布的 Kimi K2 Thinking 模型标志着中国大模型发展进入一个全新阶段。这款拥有万亿参数量级的“思考型”大模型,在多项关键能力上已接近甚至超越GPT-5与Claude Sonnet 4.5等国际顶尖闭源模型,成为全球开源阵营中首屈一指的存在。

在Artificial Analysis(AA)最新发布的全球综合评测榜单中,Kimi K2 Thinking位列第二,仅以1分之差落后于GPT-5;而在其智能体任务τ2-Bench的电信场景测试中,更是直接登顶第一,全面碾压GPT-5、Claude和Grok等主流模型。

更令人震惊的是其训练成本——据搜狐科技披露,仅为约460万美元(约合人民币3200万元)。这一数字不仅远低于OpenAI动辄数十亿美元的投入规模,也打破了此前由DeepSeek-V3创下的560万美元纪录,成为中国大模型“高效创新”的又一里程碑。

这背后的关键技术突破在于:
- 原生INT4量化技术的应用,大幅降低存储与计算开销;
- 训练感知量化(QAT)方案优化长序列生成时的延迟问题;
- 架构层面的微创新累积效应,提升强化学习效率。

尽管部分实测指出其推理token消耗较高(达GPT-5的两倍),存在“话痨”现象,影响部署成本,但其整体性能优势仍使其成为当前最具竞争力的开源基座之一。

> 深层解读:这不是一次孤立的技术胜利,而是中国AI企业在资源受限环境下“以巧破力”的系统性工程成果。它证明了:即便缺乏美国式的算力垄断,通过算法、架构与工程协同优化,依然可以逼近甚至挑战世界前沿。

---

二、从“被模仿”到“被套壳”:国产模型反向输出硅谷

如果说过去十年是“中国应用复制美国模式”,那么今天,我们正见证一场逆向技术输出浪潮的兴起——中国大模型开始成为海外产品背后的“隐形引擎”。

典型案例包括:

1. Cursor 2.0 推出 Composer 模型,被开发者揭露实为 GLM-4.6 套壳
   - GLM-4.6 是智谱AI于2023年9月发布的旗舰代码模型,号称国内最强。
   - 在LMArena大模型竞技场中排名开源第一,编程能力对标Claude Sonnet 4。
   - Cursor作为AI编程工具头部玩家,却选择“贴牌”使用中国模型,足见其实力认可。

2. Windsurf 公开承认接入 GLM-4.6
   - 面对社区质疑后非但未否认,反而宣称“应用户呼声上线”,强调其在代码生成上的卓越表现。
   - 这种“不装了”的坦率,反映出中国模型已具备足够的市场说服力。

3. MiniMax-M2 海外爆火
   - 发布数日即冲入OpenRouter调用量前三,HuggingFace下载量第一。
   - 超过20家平台提供API支持,成为事实上的国际标准组件之一。

4. Vercel 上线 Kimi K2 API,Perplexity、Genspark 等纷纷接入
   - 美国云计算公司Vercel CEO Guillermo Rauch明确表示:Kimi K2在真实场景下准确率比GPT-5高出50%,速度更快、价格更低。
   - 百度前高管景鲲在美国创办的Genspark也将Kimi纳入核心架构。

> 趋势洞察:中国大模型不再只是“追赶者”,而是正在构建自己的技术生态影响力。开源策略降低了全球开发者使用门槛,而极致性价比则构成了商业吸引力的核心。正如一位海外网友调侃:“是不是该学中文了?”——语言壁垒或许将成为下一个竞争维度。

---

三、全球AI格局重塑:多极化时代的来临

长期以来,美国凭借OpenAI、Anthropic、Google DeepMind等机构主导全球AI话语权,并依托英伟达GPU构建起强大的算力护城河。然而,随着中国模型持续突破,这种“单极主导”格局正被打破。

当前全球AI力量对比呈现三大特征:

| 维度 | 美国模式 | 中国模式 |
|------|----------|----------|
| 技术路径 | 闭源为主,垂直整合 | 开源引领,快速迭代 |
| 成本结构 | 高投入、高能耗、依赖Blackwell级芯片 | 极致压缩训练/推理成本,兼容通用硬件 |
| 商业逻辑 | 平台绑定、服务溢价 | 性价比驱动、生态共建 |
| 地缘影响 | 区域性强控制(如API封锁) | 全球可访问性高 |

目前,在AA全球最新开源模型前十名中,六款来自中国,包揽前四中的三席。Kimi K2 Thinking取代MiniMax-M2登顶榜首,形成“中国模型轮流坐庄”的新格局。

黄仁勋近期公开评价:“世界上最流行的开源AI模型都来自中国。”这句话不仅是对中国技术实力的认可,更预示着一个去中心化的AI新时代的到来——谁掌握开源生态,谁就可能定义未来的标准。

> 战略意义:开源不仅是技术选择,更是地缘科技博弈中的“软实力武器”。中国通过开放模型权重、提供低门槛API、积极参与国际评测,正在悄然建立属于自己的“AI话语体系”。

---

四、商业化困局与资本突围:独角兽们的上市竞赛

技术领先并不等于商业成功。面对高昂的研发成本与尚未成熟的变现路径,中国的AI独角兽们正面临前所未有的生存压力。

主要企业现状概览:

| 公司 | 技术亮点 | 商业化路径 | 资本动态 | 挑战 |
|------|----------|------------|-----------|-------|
| 月之暗面 | Kimi K2 Thinking登顶全球 | C端订阅(OK Computer)、API输出 | 传闻融资6亿美元,投前估值38亿 | 用户增长停滞,商业化起步晚 |
| 智谱AI | GLM系列(GLM-4.6)受追捧 | G/B端解决方案,政府项目合作 | 多地国资注资,拟科创板IPO | 曾裁员,盈利模式待验证 |
| MiniMax | M2推理模型海外火爆 | C端App(Talkie、海螺AI)、收费智能体 | 融资近3亿美元,计划赴港上市 | 对海外市场依赖度高 |
| 阶跃星辰 | 尚无显著出圈产品 | B端赋能为主 | 缺乏大规模融资消息 | 明星光环褪去,存在感下降 |

其中,智谱有望成为“大模型第一股”,若顺利登陆科创板,将极大提振行业信心。而月之暗面新一轮融资若达成,也将缓解其现金流压力,支撑长期研发投入。

> 现实反思:这些企业的估值普遍偏低——月之暗面估值不足30亿美元,不到OpenAI的1%,技术价值与资本市场认知严重错配。原因在于:
- 国内C端付费意愿弱,B/G端采购周期长;
- 缺乏类似Microsoft+Azure那样的巨头级商业化载体;
- 地缘政治导致出海受限,难以获得美元基金青睐。

因此,能否讲好“全球化+可持续盈利”的故事,将是决定它们未来命运的关键。

---

五、未来展望:中国AI的真正机会在哪里?

这场由DeepSeek、Kimi、智谱、MiniMax共同掀起的技术浪潮,绝非偶然。它是多年积累、政策引导、人才储备与市场需求共振的结果。站在当下节点,我们可以预见几个关键趋势:

1. “低成本高性能”将成为中国AI的核心标签
   - 在无法获取顶级算力的情况下,唯有通过算法创新、量化压缩、分布式训练优化等方式实现“弯道超车”。
   - 下一代模型或将探索FP8、混合精度、MoE稀疏化等方向,进一步压降训练与推理边际成本。

2. 开源生态将催生新一代“中国版Hugging Face”
   - 当前中国模型虽活跃于HuggingFace,但仍缺乏自主可控的开源社区平台。
   - 未来可能出现专注于中文语料、本土化工具链、合规审查的一站式模型分发平台。

3. C端杀手级应用仍未出现,但曙光初现
   - Kimi曾是国内流量最高的AI原生APP,但未能持续转化用户。
   - MiniMax的Talkie(虚拟陪伴)、海螺AI(视频生成)显示出C端产品的可能性。
   - 下一个爆款可能是结合语音、视觉、记忆机制的“个人AI助手”。

4. 中美AI竞争将从“模型能力”转向“生态系统之争”
   - 美国强在芯片+云服务+应用闭环;
   - 中国需构建“模型+数据+工具+场景”一体化生态。
   - 政府或将在公共数据开放、行业标准制定、国产替代采购等方面加大支持力度。

5. AI伦理与治理将成为出海必答题
   - 随着更多中国模型走向世界,内容安全、偏见控制、版权争议等问题将愈发突出。
   - 如何在保持开放的同时满足欧盟AI法案、美国出口管制等要求,考验企业的合规能力。

---

结语:这是属于中国AI的“DeepSeek时刻”,也是新纪元的起点

当Kimi K2 Thinking以不到500万美元的成本追平GPT-5,当硅谷公司开始悄悄替换为中国大脑,当全球开发者讨论是否要学中文来理解模型文档——我们知道,那个曾经只能仰望的时代,已经悄然结束。

这不是终点,而是一个起点。真正的较量才刚刚开始:  
是继续靠“性价比”赢得市场?  
还是能孕育出像ChatGPT一样的现象级产品?  
是中国版Sora、AgentOS率先问世?  
还是我们能在AGI赛道上真正并驾齐驱?

历史不会重复,但会押韵。这一次,旋律正从东方响起。

> “如果美国继续闭门造车,中国开源模型将会完全取胜。”  
> ——这不是预言,而是正在进行的事实。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个