对Deepseek从赞叹到压制,硅谷为何一周内变脸

2025-02-04 21:17:20来源:TechSir编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:对Deepseek从赞叹到压制,硅谷为何一周内变脸

  仅仅在登顶中国和美区苹果应用商店 24 小时后,国外科技巨头和监管层,对于 DeepSeek 的态度就发生了逆转。短短两天内,这家全球瞩目的中国 AI 新秀正面临着来自硅谷和华盛顿前所未有的压力。

  1 月 28 日,Sam Altman 刚发文称 DeepSeek 的 R1 模型「令人印象深刻」,美国总统称 DeepSeek 是「很积极的技术成果」——而在第二天,OpenAI 突然改变立场,对媒体指控 DeepSeekSeek 未经许可「蒸馏」了其专有技术。

  美国多位官员也发声支持这一指控,包括特朗普的人工智能顾问大卫·萨克斯(David Sacks)、特朗普提名的美国商务部长霍华德·卢特尼克 (Howard Lutnick)——「DeepSeek 利用『窃取』的美国技术和先进半导体,用极低成本创建了强大的人工智能模型。」Lutnick 当日表示。

  而白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)则声称,美国官员正在评估 DeepSeek 对美国国家安全的影响。几周前,美国商务部工业和安全局(BIS)刚将智谱增列至出口管制实体清单(Entity List),智谱成为 AI「六小龙」中第一家被列入实体清单的大模型公司。

  这一切源自 1 月 20 日 DeepSeek 发布的 R1 推理模型——它在多个逻辑任务(包括数学和编程)上的表现与 OpenAI-o1 旗鼓相当(并且远超 ChatGPT 各版本),而其运行成本仅为 OpenAI 费用的约 2%。这极大冲击了国外科技巨头的价值,微软、英伟达、甲骨文和谷歌母公司 Alphabet 等人工智能相关科技股暴跌,市值总计蒸发近 1 万亿美元。美国监管层对 DeepSeek 的态度也随之转向。

  在 OpenAI 发出指控的第二天,另一家美国科技巨头 Anthropic 则直接建议阻止 DeekSeek 等中国公司的创新。1 月 30 日,Anthropic CEO Dario Amodei 发文呼吁美国政府加强对中国的芯片管制,以确保 AGI 只发生在美国。

  这同样引起了政府的回应。同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性,其中包括 Dario 建议限制的芯片 H20。

  两天之内,美国科技巨头及监管层对 DeepSeek 的态度由溢美转向压制,反映了其对自身「科技霸权」动摇的深层忧虑。随着 DeepSeek 等中国科技公司日益立于潮头,大洋彼岸的技术封锁也从算力、扩展到了模型等更广泛领域。目前的事件或许只是一个开端。

  或许,历史将证明封闭和封锁并非维持优势的有效手段,甚至反而可能催生出如 DeepSeek 的巨大创新。开放与合作才代表未来。

  而在这个未来到来之前,以 DeepSeek 为代表的中国科技公司,或许需要找到长期的应对之策。

  「蒸馏」不等于「窃取」

  此次 DeepSeek 的大模型「蒸馏」争议,起源于 OpenAI 的最大投资方微软。

  1 月 29 日,外媒报道,微软的安全研究人员发现,DeepSeek 相关人士可能使用 OpenAI 应用程序编程接口 (API),未经授权「窃取」了大量数据。微软已将这一活动通知了 OpenAI。

  当日,OpenAI 向外媒透露,它发现了 DeepSeek 使用「蒸馏」技术相关的证据。所谓的「蒸馏」,指通过对更大、更强模型的学习,让小型模型能够在特定任务上以更低的成本取得类似效果。相当于「徒弟」学「师傅」。

  针对这种指控,DeepSeek 并未做出回应。

  谈到大模型的「蒸馏」,并不等于窃取,其实是行业的一种常见做法。无论是在中国还是美国,AI 实验室普遍会使用 OpenAI 等领先公司的输出数据进行训练。「这意味着它们(新模型)可以免费获得人类反馈优化的成果。我并不惊讶 DeepSeek 可能也在这样做。」加州大学伯克利分校人工智能博士生 Ritwik Gupta 表示。

  Ritwik Gupta 认为,真正核心的问题在于,「当用户利用数据来创建自己的模型并用于自身目的时,就会存在争议。」

  OpenAI 的服务条款规定,用户不能「利用输出内容开发与 OpenAI 竞争的模型」。

  「与 OpenAI 竞争的模型」,这个定义有一定的解释空间。例如 DeepSeek-R1 是一个开源模型,面向公众开放,而非自己商用,不一定符合这个定义。

  唯一可以确定的是,OpenAI 正在加速封锁自己的出口、甚至谨慎释放自己的技术实力。可以说,它更极致地执行「闭源」。OpenAI 在声明中称,中国公司和其他公司一直在试图「蒸馏」美国领先 AI 公司的模型,OpenAI 将采取一系列反制措施来保护知识产权,包括在发布模型时审慎决定纳入哪些前沿能力。

  这不只是公司意志,更是国家意志。OpenAI 称未来与美国政府密切合作至关重要,「这样才能更好地保护最强大的模型,防止对手和竞争对手获取美国技术。」

  1 月 28 日,谷歌前首席执行官兼董事长 Eric Schmidt 联合撰写了一篇文章,文章名为《中国的开源人工智能会终结美国在该领域的霸权吗》。Schmidt 表示,DeepSeek 崛起之后,目前全球 AI 领域的权力格局似乎正在围绕两个关键轴转移:一是中美之间的竞争,二是封闭与开源模式的较量。

  闭源和开源的互补

  这是一个颇具戏剧性的时刻:中国科技公司从过去全球开源的受益者,逐渐变成了开源的反哺者、甚至引领者——从巨头阿里巴巴、初创公司 Minimax、再到此次爆火的 DeepSeek 等,均通过开源向全球开发者免费开放 AI 模型、反哺全球科技生态。

  而大多数美国主要科技公司(除了 Meta 之外),仍坚持闭源,并更严格地保密其技术方法。

  海外网友甚至调侃 OpenAI 为「CloseAI」。

  与此相对的是,DeepSeek 这样的科技公司,通过开源以及与 AMD、华为等厂商的紧密合作,成为了真正「Open」的 AI 公司。当全球无数开发者得以在本地设备上部署运行 R1 模型、并由此衍生出各种应用场景用法,DeepSeek 因此获得了全球开发者的支持、为现在的「爆红出圈」打下了基础。

  这证明了开放,才是 AGI 时代最核心的竞争力之一。

  即使 OpenAI 现在出来表示「DeepSeek 的研究成果我们更在之前也发现了」,但 DeepSeek 作为率先开源的厂商,仍然收获了全球各地用户与开发者最多的掌声:

  将自己走过的路公布出来,让其他人可以少走弯路,快速收敛到最优路径上,开源的意义就在于此。

  更重要的是,开源被证明拥有不输于闭源的价值。

  此前,由美国构建的闭源模型(如 OpenAI 的 o3 和 Anthropic 的 Claude 3 Opus)一直被视为行业标杆。而开源模型(尤其是中国的开源模型)通常被认为落后几个月。然而,DeepSeek 的 R1 和多模态模型 Janus Pro 彻底彻底改变了这一认知。

  当开源模型能在性能上追平闭源对手,这可能会颠覆整个人工智能行业的生态。其低成本优势必将吸引更多开发者,最终可能在这场技术角逐中获胜。

  使用容器 App 等方式,已经可以实现完全在手机端侧运行 DeepSeek R1 模型 | 图片来源:X

  海外社交媒体上频繁出现这样的「反思」:AGI 时代,依靠着开源与合作,中国同样有机会比美国更先到达 AI 领域的下一个节点。

  Eric Schmidt 在文章中呼吁,美国已经拥有世界上最好的闭源模型,为了保持竞争力,还必须支持一个充满活力的开源生态系统的发展。「开源和闭源竞争很可能会找到一种自然的平衡,为不同用户带来一系列不同的产品和价格点。」他说。

  OpenAI(以及一众 AI 大厂)和 Deepseek(以及期待更多 AI 新锐)的理想状态,更应该是一幅太极图:闭源对开源、充裕对短缺、外扩对内修、大力对灵巧……看似相克,实则相生。

  只有两者互补、而非对立,才有利于人类通向 AGI 之路。因为后者会带来对抗,而前者则能形成合力。

  开放,才是未来

  在对 DeepSeek 的赞誉之后,大洋彼岸的科技巨头与政府迅速转变态度,核心是在政策层面加速「封锁」。

  1 月 29 日,在 DeepSeek「蒸馏」指控之后,白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)表示,美国官员正在评估 DeepSeek 对美国国家安全的影响。

  30 日,Anthropic 的 CEO Dario Amodei 直接发文呼吁美国政府加强对中国的芯片管制。他认为 DeepSeek 的成功并未降低美国芯片算力的价值,相反在通往 AGI 的道路上,未来仍需要数百万块芯片、数百亿美元(至少)。只有继续加剧出口管制,才能保证美国的技术单极「霸权」。

  同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性。报道指出,限制措施将涉及英伟达公司的 H20 芯片——这正是 Dario 在文章中建议要限制的芯片,过去由于其训练效率较低,它被允许出口。据消息人士透露,关于限制措施的决定很可能不会很快做出。

  DeepSeek 还面临着来自现实物理层面的挑战。据网络安全公司奇安信的专家证实,自 1 月 28 日起,该公司遭遇了来自美国 IP 地址的持续网络攻击,包括 DDoS 攻击和密码破解等多种形式。两天后,攻击暴增百倍。

  1 月 28 日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击 | 来源 DeepSeek

  这些事件背后折射出的深层事实是:随着 DeepSeek 等中国科技公司的崛起,其极大地冲击了国外科技巨头,并动摇了美国长期以来的「科技霸权」。后者似乎想沿用过去的技术限制和封锁手段,维持其主导地位、阻止这一进程。

  如果说过去主要封锁的是算力,现在则是同时封锁算力和模型。

  但历史可能会证明,试图通过技术封锁来维持优势的做法终将失效。就像过去对算力的限制一样,这种封锁不仅无法阻挡创新,反而催生出了 DeepSeek 这样的巨大创新。

  或许在迈向 AGI 的征程中,开放,才是真正的核心竞争力。

  更何况,开源模型不是 TikTok 那样依赖互联网的在线服务,它自带「跨越封锁」的属性:如今不仅是高性能主机的用户可以在端侧运行 DeepSeek R1,有开发者甚至研究出了使用本地 App,让蒸馏后 1.5B 大小的 DeepSeek R1 能够完全离线端侧运行在 iPhone 上。这意味着它很难被真正封锁。

  「美国的竞争优势长期以来依赖于开放科学、以及产业、学术界和政府的协同合作。我们应该重新拥抱开放科学的可能性,让其再次成为推动美国 AI 发展的动力。」Eric Schmidt 称。

  科技从业者的普遍观点是,硅谷科技公司应该追求科技「领导力」而非「霸权」。因为后者必然引发抵抗,产生离心力,难以长期维持。而前者能促进合作,凝聚向心力,推动人类科技进步。硅谷当前确实拥有科技「领导力」,但若一味追求「霸权」地位,反而可能失去这一核心优势,最终作茧自缚被更多具有创新思想的创业者反超。

  开放,才是真正的未来,DeepSeek 就是最好的代表。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
情暖春运路 归心向家途 情暖春运路 归心向家途

记者从铁路12306科创中心获悉,1月11日开始发售1月25日(腊月廿六)车票,铁路

原创观点2025-01-11

新春高铁焕新 共筑团圆坦途 新春高铁焕新 共筑团圆坦途

记者8日从国务院新闻办新闻发布会上了解到,今年春运,部分客流集中方向新

原创观点2025-01-09

高铁飞速前行 文化滋养缓缓流淌 高铁飞速前行 文化滋养缓缓流淌

记者从中国铁路南宁局集团有限公司获悉,29日,广西已实现14个设区市高铁读

原创观点2025-01-07

反对新时代黄牛,支持铁路先行 反对新时代黄牛,支持铁路先行

铁路12306平台是中国铁路面向社会提供互联网票务服务的唯一官方渠道,致力于

原创观点2024-12-17

40亿人舒适旅途的背后 40亿人舒适旅途的背后

记者从国铁集团获悉,今年1至11月份,全国铁路累计发送旅客40.08亿人次,年度

原创观点2024-12-12

铁路赋能,温暖冬日 “煤” 保障 铁路赋能,温暖冬日 “煤” 保障

从本月15日开始,我国北方地区全面启动供暖工作,与此同时,能源的需求大幅

原创观点2024-11-25

卢伟冰:REDMI坚持极致性价比 对任何挑衅“不服 卢伟冰:REDMI坚持极致性价比 对任何挑衅“不服

原标题:卢伟冰:REDMI坚持极致性价比 对任何挑衅不服就干 11月21日消息,今日

原创观点2024-11-21

从“换轨施工”中 品“铁路人生” 从“换轨施工”中 品“铁路人生”

11月12日,一个平平常常的下午,天空被一层厚重的云层覆盖。新丰一场东部正

原创观点2024-11-13

任正非:中国教育系统对小孩要宽容些 快乐远超 任正非:中国教育系统对小孩要宽容些 快乐远超

原标题:任正非:中国教育系统对小孩要宽容些 快乐远超死记硬背、金钱...

原创观点2024-11-02

知乎CEO回忆求职经历:从月薪2000干起、靠一篇文 知乎CEO回忆求职经历:从月薪2000干起、靠一篇文

原标题:知乎CEO回忆求职经历:从月薪2000干起、靠一篇文章成功转正 10月31日消

原创观点2024-10-31