开云体育(中国)官方网站可是DS在工程上作念了好多创新-开云(中国)kaiyun体育网址登录入口

发布日期：2025-07-28 05:18 点击次数：108

（原标题：DeepSeek是并列OpenAI的国产AI之光吗？）开云体育(中国)官方网站

“梁文峰以及他的团队彰着是一群有“利润之上”的追求的东说念主们。”，这是段永平在雪球平台上对DeepSeek的评价。印象中，他上一次给出这样高评价的CEO，已经对苹果乔布斯的评价。

从2024年12月16日发布DeepSeek-V3后，在好意思国的AI圈获得了行业内行极高的评价，比如OpenAI创始团队成员卡帕斯（Andrej Karpathy）、英伟达的高等科学家Jim Fan等等。由于影响力太大，连OpenAI的CEO 山姆·奥特曼（Sam Altman）也出来发推阴阳了几句。

一、DeepSeek的才略与OpenAI最佳的模子不相高下

1. 从DeepSeek-R1论文中与ChatGPT的各项才略标的对比来看，DeepSeek（后文简称为DS）如实是中国唯独不错并列ChatGPT的AI大模子。

2. DS-V3的才略，在各项才略的测评上与ChatGPT-4o不相高下。

这些评测（benchmarks）是由计议东说念主员经神思算，以推断 AI 在推理、数学、编程、学问问答、谈话调和等方面的才略。是以，评测松手的对比参考价值相配大。

二、DS-V3与DS-R1

上图中，在不遴荐深度想考（R1）时，DS默许是用V3回话的。在场景和才略上对标ChatGPT的4o。R1则对标o1，从前边的图表不错看出，R1在各项才略上王人要比V3强出好多。

DS-V3 为自研 MoE 模子（内行夹杂模子），举个栗子讲解MoE：

遐想一个餐厅，有不同厨师（内行），每位擅长一种菜系（如中餐、意大利菜、甜点）。主顾点菜时，司理（门控网罗）笔据菜品决定由哪位厨师认真。比如点披萨，意大利菜厨师接办；点宫保鸡丁，中餐厨师不竭。司理确保每说念菜由最相宜的厨师完成。（开始于DS-V3）

DS-R1在后西宾阶段大限度使用了强化学习（RL）时刻，在仅有小数标注数据的情况下（ChatGPT使用了广博的东说念主工标注数据），极大升迁了模子推理才略。举个栗子讲解纯强化学习（无监督数据）：

纯强化学习就像自学成才的厨师，通过无间尝试和失败，最终掌持竣工煎蛋的手段。固然过程笨重，但一朝班师，才略将相配遒劲且自主。（开始于DS-V3）

三、DS在工程上作念了好多创新

从各项才略的评测松手来看，开源的DS朝上统共的开源模子，况兼与最佳的闭源模子（OpenAI的）不相高下，莫得创新是不能能作念获得的。时刻门道和一些门径是老早就有的，可是DS在工程上作念了好多创新。就像马斯克并莫得发明新的火箭与新的汽车，可是他通过工程创新极大的裁减了造火箭的老本，升迁了造火箭的着力。在电板上亦然通过工程创新极地面裁减了老本，减少了与整车的老本比例。

DS在工程上的创新：1. 无监督RL西宾翻新：首创跳过监督微调（SFT）的纯强化学习旅途，径直在基础模子上专揽2. 高效蒸馏时刻：通过80万条RL生成数据，将R1的推理才略蒸馏至1.5B-70B限度模子，罢了小模子性能飞跃（如Qwen-32B在AIME 2024达72.6% pass@1）。（OpenAI的模子没开源，能看到的王人是最终松手，这是没法蒸馏的。蒸馏需要敦朴模子的输出概率漫衍，拿学生模子的输出概率漫衍和敦朴的概率漫衍对比算一个KL散度赔本函数，通过反向传播一步步优化学生模子的参数，标的是让学生模子的输出概率漫衍冉冉接近敦朴漫衍。唯独最终松手莫得di概率漫衍，你失去了绝大多数的灵验信息，学不了的。AI行业内行@DrChuck ）考据蒸馏成果优于径直小模子RL西宾，为资源受限场景提供高效决议，推理老本裁减80%。

3. 自适合MoE内行遴荐：动态路由算法+细粒度内行分散（128内行选2），比拟密集模子减少70%计较量，长文本不竭速率升迁40%。

创新点好多，就不逐个列举了。V3与R1的创新点对比：

备注：以上内容是通过DS阅读V3和R1论文归来获得的。

四、DS对AI生态的影响

大模子AI的三成分：数据、算法、算力。影响最大的是算法、算力。

1.算法

DS完全开源（最强的OpenAI是闭源），由于在工程上有好多创新，无疑给中国AI大模子创业带来了班师的晨曦。印象中百度李彦宏在2024年采访中提到，中国莫得契机再出身OpenAI这样的公司，DS的出现冲突了竞争表情。接下来抖音集团、腾讯、阿里等头部作念大模子的公司，粗略率王人会跟着DS的门径跟上。

2.算力

DS-V3的西宾老本仅为557万好意思元，约为OpenAI、谷歌等公司的几十分之一。以Llama-3.1为例，其西宾需要16000张H100卡且耗时数月，而DS-V3仅使用2048张H800卡，在两个月内就完成了西宾，计较量约为Lama-3.1的八分之一。推理老本方面，DS-V3的每百万token用度仅为1好意思元，约为GPT 4 Turbo的七十分之一。

经过工程上的创新，同等AI才略的情况下，算力老本会大幅着落。不外，西宾老本的着落意味着API老本也会大幅着落，这有益于C端专揽的爆发，从而刺激更大的算力需求。芯片算力上，英伟达是统统的朝上者，从英伟达设立的CUDA生态来看，在西宾阶段当今仍难有替代者。DS这类大模子能否绕开英伟达的 CUDA 时刻？谜底是时刻上不错，但本色要看具体情况。

分两个场景看：

1. 推理（使用西宾好的模子）：

完全不错绕开，就像手机软件换个手机也能驱动。模子西宾好后仅仅一堆参数，用国产显卡（如天数、华为）或配套软件也能正常使用，不依赖 CUDA。

2. 西宾（从新教模子学习）：

当今可能仍用英伟达显卡（如公开贵府败露 DeepSeek 在用 H800 芯片），但时刻上存在替代决议：

决议一：用国产显卡（如天数）兼容 CUDA 生态，实测可行但速率可能稍慢。

决议二：用华为显卡+自研软件（如昇腾芯片+MindSpore 框架），或适配国产硬件的 PyTorch 版块，能罢了西宾但需调度时刻过程。

备注：以上内容是笔据行业从业者发言整理的@段嘉铭

结语：

开源的DS将会给我方设立起很强的竞争壁垒，因为关于AI专揽，强人确切会占有绝大部分用户，然后在AI的三成分上轮回补强。看了梁文峰的不少发言，梁文峰不仅有才略，还有很大的表情，笃信在组织进化才略上也很强。

DS最佳的模子王人开源，西宾、推理老本均大幅着落，这无疑给平常的创业者带来了庞大的契机，这个契机就好比早期的互联网创业。是以，年青的一又友们也得攥紧期间计议起来，这样的契机统统是几十年一遇！！！

$英伟达(NVDA)$ $腾讯控股(00700)$ $阿里巴巴(BABA)$ 开云体育(中国)官方网站