周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[丹艳庆]投稿,不代表发展号立场,如若转载,请注明出处:https://www.fastcode.vip/txbk/202506-2238.html

(59)

文章推荐

  • 这家券商公开招聘资管总经理

    2025年以来,券商及其子公司的高管变更潮仍在延续。截至目前,已有华兴证券、中信建投证券、国开证券、国元证券、长江证券等10余家券商完成董事长、总裁等重要高管的更换。近日,国盛证券官网发布一则关于公开选拔国盛资管总经理的公告。天眼查显示,目前,国盛资管董事长、总经理由王宁担任。业内人士分析称,目

    2025年03月19日
    57
  • 欧洲国防股回落 萨博评级下调

      欧洲主要军工企业的股价周三下跌,此前在欧洲提高军费开支的政治决定刺激下大幅上涨。出于对估值的担忧,丹斯克银行下调萨博评级。  萨博股价一度下跌9%,创下去年9月以来最大跌幅。  莱茵金属跌5.5%,Hensoldt跌8.6%,Renk跌8.3%,萨博跌8.2%。  高盛欧洲国防股篮子指数一

    2025年03月19日
    59
  • 奸情技巧打哈儿麻将有挂吗(详细开挂教程)(419游戏推荐手把手教你进阶约炮达人)

    4.19本来是一个平淡无奇的日子,但是因为改革开放的春风使得天朝与国际接轨,从而赋予了这个日子一个神圣的意义four(for)onenine(night),刀疤强知道在现如今扫黄整风的风口下大谈这个是有点作死的味道,但是为了造福广大玩家,牺牲刀疤强一个又会如何?昨天刀疤强搅尽乳汁整理的手游界约炮

    2025年03月22日
    65
  • 洛克王国耳机狗洛克王国耳机狗绝版了吗

    洛克王国耳机狗怎么得洛克王国耳机狗是通过参加洛克王国游戏中的特定活动获得的。要获得洛克王国耳机狗,玩家首先需要关注游戏内的公告和活动信息。游戏开发者会不定期推出各种限时活动,其中可能包括获得耳机狗的机会。这些活动可能要求玩家完成特定的任务、达到一定的等级、或者在特定的时间内登录游戏等。洛克王国怪萌

    2025年03月27日
    55
  • (聚焦博鳌)毕马威中国副主席:中国AI发展正迎来黄金期

    专题:博鳌亚洲论坛2025年年会  中新社博鳌3月27日电题:专访毕马威中国副主席:中国AI发展正迎来黄金期  中新社记者刘亮  “中国AI(人工智能)发展正迎来黄金期。”博鳌亚洲论坛2025年年会正在海南博鳌举行,毕马威中国副主席、首席技术官及创新主管合伙人刘建刚在此间接受中新社记者专访

    2025年03月27日
    75
  • 促甲状腺激素促甲状腺激素偏高

    促甲状腺激素过高怎么回事,促甲状腺激素高可能由以下几种情况引起:原发性甲状腺功能减退:这是最常见的原因之一,当甲状腺本身功能减退时,无法产生足够的甲状腺激素,为了弥补这种不足,腺垂体会分泌更多的促甲状腺激素来刺激甲状腺生长和分泌。垂体本身分泌的促甲状腺素水平的增高,引起增高的原因,主要是因为垂体瘤

    2025年04月07日
    47
  • 奥联电子维权案件得到实质性推进,符合条件的股民还可登记

    登录新浪财经APP搜索【信披】查看更多考评等级  一、信披违规遭监管处罚  上海沪紫律师事务所刘鹏律师团队代理的投资者诉奥联电子(维权)证券虚假陈述案有了新的进展,部分案件于近日已收到法院送达的相关机构核算结果,后续进程将会逐步加快。(刘鹏律师专栏)  案件回溯,公司因信息披露违法违规于今年

    2025年04月08日
    54
  • 小儿发烧用药小儿发烧用药后手脚冰凉怎么回事

    小儿病毒发烧吃什么药儿童发烧发热通常是由于感染引起的,感染类型包括细菌性、病毒性和真菌性等。在家中初期处理时,可以考虑使用对乙酰氨基酚口服液,这种药物适用于缓解儿童的发热症状。如果孩子服用上述药物后仍感到不适,建议立即到医院进行复查。值得注意的是,当儿童体温超过38度时,家长应提高警惕。小儿病毒性

    2025年04月16日
    46
  • 华润银行2024年净利润仅为2022年的22.4%

      “数据显示,2024年华润银行实现净利润4.49亿,归母净利润4.44亿。而这2022年,这两项数据为20.03亿和19.95亿。也就是说,去年该行的净利润和归母净利润仅相当于2022年的22%左右。”  近日,华润银行发布了2024年年度报告。  报告显示,2024年,华润银行实现营业收入

    2025年05月12日
    37
  • 突发! 一A股公司董秘被证监会立案

    登录新浪财经APP搜索【信披】查看更多考评等级  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  6月9日晚间,瑞丰高材(300243)披露公告称,公司于当日收到公司董事会秘书赵子阳的通知,其于当日收到证监会出具的《立案告知书》,证监会决定对赵子阳因涉嫌内幕交易予以

    2025年06月10日
    19

发表回复

本站作者后才能评论

评论列表(4条)

  • 丹艳庆
    丹艳庆 2025年06月14日

    我是发展号的签约作者“丹艳庆”!

  • 丹艳庆
    丹艳庆 2025年06月14日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • 丹艳庆
    丹艳庆 2025年06月14日

    本站[发展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 丹艳庆
    丹艳庆 2025年06月14日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:发展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们