Scaling

市值一夜蒸发超4万亿元!英伟达回应:DeepSeek是出色的AI进步

美东时间周一,美股AI龙头英伟达股价惨遭暴击:单日收盘下跌16.86%,创美股历史上最大单日个股蒸发规模,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)。光是蒸发的市值,就足足相当于3个AMD或近18个寒武纪公司市值。而这一暴跌背后的原因,是一股“来自东方的神秘力量”:国产大模型公司杭州深度求索上周发布的DeepSeek R1模型。该模型在数学、编程和推理等关键领域的表现甚至能媲美O

郭明錤:DeepSeek加速生成式AI产业迈入新阶段

【郭明錤:DeepSeek加速生成式AI产业迈入新阶段】财联社1月31日电,天风国际证券分析师郭明錤发布报告指出,DeepSeek-R1发布后,有以下两个重要的AI产业新趋势值得关注。就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现,加速了趋势发生。一、Scaling Law边际效益放缓时,AI算力仍可透过优化训练方式持续成长并有利挖掘新应用。二、API/To

豆包提出全新稀疏架构 降低推理成本

新京报贝壳财经讯 2月12日,据“豆包大模型团队”微信公众号,近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。该研究还揭示了新架构的 Scaling Law,证明其不仅具备优异的 Scaling 特性,更在性能上超越了 MoE。实验结果表明,训练规模达 20

马斯克向左 梁文锋向右

2月18日,创立xAI的埃隆·马斯克发布了号称“地球上最聪明AI”的Grok3大模型,展示了其在多项测评中超越o3-mini,摘得桂冠的技术实力。而同一天,DeepSeek的梁文锋和Kimi的杨植麟分别在专业网站上发布了自己参与的论文,这两篇论文均与如何减少长文本计算量,加快训练效率有关。这反映了中美AI大模型路线上最本质的差异:Grok3采用20万张英伟达H100芯片训练而成,达成优异性能的同时

兴业证券:AI应用“多点开花”或将推动更多“AI+”领域延伸扩散

【兴业证券:AI应用“多点开花”或将推动更多“AI+”领域延伸扩散】财联社2月20日电,兴业证券发布研报称,随着2023年初ChatGPT问世引爆全球人工智能产业趋势,推动AI成为全球科技板块的核心主线,但行情的演绎主要集中在上游算力端。在Scaling Law和全球算力需求高增逻辑下,以光模块、AI芯片为代表的上游算力作为“卖铲人”显著受益。而AI应用落地进展相对低于预期,中游软件服务和下游应用

“大力出奇迹”VS“四两拨千斤” AI大模型发展路径之争将带来哪些巨变

一边是“大力出奇迹”,一边则瞄准“四两拨千斤”,2025年,AI大模型“下半场”有了新打法:路径分化,拥抱开源。“一方面,部分国家为保持在AI领域的领先优势,会不断地‘卷算力’‘卷数据’‘拼规模’;另一方面,我国的AI发展路径已经逐渐明显,在持续推进算力基础设施建设的同时,做普惠AI,这样就能形成明确的差异化优势。”——————————DeepSeek的横空出世及开源策略正在牵动大模型赛道的分化,