• 二氧化碳气爆设备生产厂

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

科大讯飞:讯飞星火在国产算力上罢了锻练和推理

发布日期:2025-03-24 07:37    点击次数:107

有投资者向科大讯飞发问, De e p S e ek火爆寰球,干系技能对星火大模子的发展有无模仿学习的,愈加加速星火发展?超低算力的模子技能,针对讯飞算力一直不及的问题是否有匡助?讯飞的干系家具会径直接入De e p S e ek么? 公司回报暗意,您好,1、DeepSeek 团队围绕 DeepSeek V3 和 R1 的锻练和推理降本,罢了了多个有用的软硬件勾通深度工程优化立异。和 DeepSeek 访佛,科大讯飞受限于有限的算力资源,昔时几年对于星火大模子锻练和推理资本效用的抓续优化也作念

  • 有投资者向科大讯飞发问, De e p S e ek火爆寰球,干系技能对星火大模子的发展有无模仿学习的,愈加加速星火发展?超低算力的模子技能,针对讯飞算力一直不及的问题是否有匡助?讯飞的干系家具会径直接入De e p S e ek么?

    公司回报暗意,您好,1、DeepSeek 团队围绕 DeepSeek V3 和 R1 的锻练和推理降本,罢了了多个有用的软硬件勾通深度工程优化立异。和 DeepSeek 访佛,科大讯飞受限于有限的算力资源,昔时几年对于星火大模子锻练和推理资本效用的抓续优化也作念了大批插足,和 DeepSeek 径直使用英伟达卡上开展的各式工程优化不同,科大讯飞采取了更难的寰宇产算力路子。从 2023 年 5 月起科大讯飞就连合华为先后攻克了万卡高速互联组网、联想通讯荫藏、锻练推理强交互、高糊涂推理优化以及国产算子优化等一系列艰苦,将通用大模子、类 o1 的深度推理模子等的锻练效用对标 A100 均从领先的 30%-50%优化达到了 85%-95%以上;以 DeepSeek 尽头垂青的万卡相聚通讯带宽的诓骗率为例,DeepSeek 报谈的是 93%,而讯飞星火作念到了 95%。锻练资本亦然讯飞星火大模子的竞争上风,咱们单次锻练资本和 DeepSeek V3 在一个档次,而且后头优化旅途也很明确,当今以昇腾 910B 为代表的国产硬件还不守旧 FP8 精度锻练以及 DualPipe 的罢了,跟着国产算力在底层才气上进一步进步,讯飞星火的锻练资本还有较大的下落空间。2、需要尽头诠释的是,大模子对算力的需求为锻练和推理两个方面,而锻练罢了的难度巨大于推理。这便是固然不息有公司晓示不错在国产算力平台上提供 DeepSeek 在内等大模子的推理劳动,但仍独一讯飞星火一家是锻练和推理均在国产算力上进行的,况兼仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个数目级的算力得到了大模子研发上的第一梯队后果,而且作念了大批国产算力平台上的无东谈主区的适配和效用优化,追求国产算力的极致效用,这比在英伟达上的罢了更需要技能实力和计策勇气。公司在最近一期的投资者疏导活动中对讯飞星火在大模子锻练和推理的软硬件工程化方面的技能蕴蓄进行了详备解读,具体情况可详见公司在巨潮资讯网//www.cninfo.com.cn/new/disclosure/stock?orgId=9900004565&stockCode=002230#research上线路的《2025年2月13日投资者关系活动记载表》。感谢瞻仰。

    海量资讯、精确解读,尽在新浪财经APP

相关资讯