周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[丹艳庆]投稿,不代表发展号立场,如若转载,请注明出处:https://www.fastcode.vip/txbk/202504-2238.html

(44)

文章推荐

  • 强壮梦幻西游强壮梦幻西游攻略

    梦幻西游强壮加多少血强身技能等级越高,可能使得强壮技能提供的气血加成更为显著。技能上限:强壮技能的上限为40级,即玩家最多可以通过学习强壮技能增加600点气血上限。请注意,这些数值可能因游戏版本更新或特定服务器设置而有所变化,建议玩家在实际游戏中以当前版本的游戏规则为准。,梦幻西游强壮点满能加多少

    2025年03月06日
    40
  • 岩石大厅岩石大厅怎么传送到门口去

    wow岩石大厅在哪1、wow岩石大厅位于艾泽拉斯大陆的诺森德地区,具体位置在风暴峭壁的深处。岩石大厅是魔兽世界中的一个著名副本,也是冰冠冰川地下城的一部分。这个副本以其壮丽的冰雪景观和具有挑战性的任务而闻名。进入岩石大厅需要玩家达到一定的等级,并且通常需要组成一支由不同职业和专长的玩家组成的队伍来

    2025年03月10日
    50
  • 奸情技巧填大坑可以开挂吗”!详细开挂教程(确实真的有挂)(撞破妻子奸情我选择直接修仙全本阅读楚辰赵丽丽全集阅读)

    小说:撞破妻子奸情?我选择直接修仙主角:楚辰赵丽丽作者:我是车手类型:古代言情这本书主要讲述的是:书名:《撞破妻子奸情?我选择直接修仙》本书主角有楚辰赵丽丽,作品情感生动,剧情紧凑,出自作者“我是车手”之手,本书精彩章节:‘楚辰’呵呵一笑,摸了摸没有胡须的下巴,道:“你这病吃了赤阳草也没有多大效果的

    2025年03月21日
    35
  • 31省新增本土1例(31省份新增本土确诊病例1例)

    据国家卫健委网站消息,5月7日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例1例,为本土病例(在吉林);无新增死亡病例;新增疑似病例3例,均为境外输入病例(在上海)。当日新增治愈出院病例36例,解除医学观察的密切接触者645人,重症病例减少5例。境外输入现有确诊病例219例

    2025年03月24日
    51
  • 卫岗牛初乳卫岗牛初乳怎么样

    南京卫岗的销售工作怎么样?1、总的来说,南京卫岗的销售工作需要较强的耐心和沟通技巧,同时也是一次提升自我能力的宝贵机会。2、总的来说,应聘南京卫岗乳业的销售人员是一个不错的选择。企业内部的氛围非常好,员工之间的合作也非常融洽。如果你具备良好的沟通能力和销售技巧,相信在这里能够实现个人价值的提升。同

    2025年04月03日
    31
  • 反刍技巧竹间茶馆开挂有挂吗(详细开挂教程)(中国作家网原创频道2024年度文学之星揭晓)

    中国作家网原创平台“本周之星”栏目已经走过第五个年头,五年来,我们一直致力于搭建一个可以让原创作者自由成长、积极交流与充分展示的平台,也努力将“本周之星”栏目的品牌打造得更加闪亮。我们不断发掘新人,也常常与老作者重逢,有越来越多的作者成为中国作家网原创平台的忠实用户,通过“本周之星”栏目起飞、远航。

    2025年04月06日
    39
  • 低聚肽低聚肽石榴饮真的能减脂肪吗

    松茸复合低聚肽粉有那些功效松茸复合低聚肽粉的作用为:低聚肽可以降血脂、降血糖、提高人体免疫力。在临床中低聚肽的作用主要体现在抑制胆固醇上升,可以促进胰岛素分泌,调节人体的血糖,改善糖尿病的症状。不属于。松茸复合低聚肽粉属于植物蛋白肽,不属于小分子活性肽。松茸复合低聚肽粉的作用为:低聚肽可以降血脂、

    2025年04月11日
    37
  • 治疗哮喘的药治疗哮喘的药可以治咳嗽吗

    狗狗哮喘吃什么药1、治疗狗狗哮喘的药物主要包括:支气管扩张剂:常用于缓解支气管痉挛,比如氨茶碱、茶碱类药物等,可以舒缓呼吸道。糖皮质激素:能减轻炎症反应,常用的有可的松、泼尼松等,但要注意使用过程中的副作用。抗生素:如果狗狗出现细菌感染,医生可能会开具抗生素,以抑制感染。2、治疗哮喘的药物种

    2025年04月15日
    29
  • 华致酒行2024净利降8成 2019上市募9.7亿西部证券保荐

      中国经济网北京4月18日讯 华致酒行(300755.SZ)昨晚披露的2024年年度报告显示,公司去年实现营业收入94.64亿元,同比下降6.49%;归属于上市公司股东的净利润4444.59万元,同比下降81.11%;归属于上市公司股东的扣除非经常性损益的净利润2517.35万元,同比下降85.9

    2025年04月18日
    21
  • 鲖鱼鲖鱼图片

    鲖鱼是什么鱼?鲖鱼是古之贡鱼。盛产于鲖城护城河而得名,鳞片金黄,鳍尾鲜红,状如鲤鱼,体形美观。其肉成蒜瓣型,肉质细嫩,味道鲜美。栖息于江河流水环境,为下层鱼类。喜集群,在深潭或深水河槽越冬。4~5月间在水流湍急的江段产漂流性卵。鲖鱼是古之贡鱼。鲖鱼是一种古老的鱼类,也被称为鲟鱼或鳇鱼,属于鲟形目鲟

    2025年04月22日
    15

发表回复

本站作者后才能评论

评论列表(4条)

  • 丹艳庆
    丹艳庆 2025年04月29日

    我是发展号的签约作者“丹艳庆”!

  • 丹艳庆
    丹艳庆 2025年04月29日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • 丹艳庆
    丹艳庆 2025年04月29日

    本站[发展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 丹艳庆
    丹艳庆 2025年04月29日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:发展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们