难怪DeepSeek的创始人被总理接见，还登上了新闻联播！

发布日期：2025-02-05 13:12 点击次数：192

Deepseek恐怕做梦都没料到，一个业余的AI团队，转眼间竟已与华为、TikTok 比肩齐名了。这家成立于2023年的的AI公司Deepseek先是在外网火了，许多人预言：Deepseek很可能会戳破美国史上最大的AI泡沫。

这两天，总理邀请 Deepseek 创始人梁文锋参加座谈会，相关报道更是登上《新闻联播》，一时间引发广泛关注。

随后，微软的总裁纳德拉、扎克伯格以及OpenAI的创始人奥特曼都对Deepseek表示赞赏。整個美國的AI界也在关注Deepseek推出的V3和R1大模型。

扎克伯格直接表示，他呼吁美国政府尽快限制中国的AI技术，并指出Deepseek对美国国家安全构成威胁。他要求所有AI领域的员工积极参与研究Deepseek的大模型。

扎克伯格感到焦虑，因为支撑Meta公司股价的正是占据市场优势的开源LLaMA模型。这一模型的投入已超过1000亿美元，原本还打算再投资650亿美元以建立护城河，但结果Deepseek只用了一位Meta高管的薪资，就成功开发出超越他们多年来花费上千亿研发出的开源LLaMA模型。

最关键的是对方的主要业务是进行“量化交易”，后面又开展了一个副业——AI大模型，结果竟然威胁到了美国的国家安全。你说扎克伯格能不着急吗！！！

Meta公司最初的目的是希望通过开源的LLaMA模型，广泛掌控全球商业领域，甚至能够借助AI技术来影响各个公司的生产力水平，使其开源模型在AI时代如同水电一般不可或缺。

Deepseek推出后，扎克伯格惊呆了，不仅导致英伟达的股价下滑，还有可能打击美国历史上最大的AI泡沫。

Deepseek改变了整个AI大模型的研发方式。在发布后，Deepseek仅利用了一小部分芯片和不到600万美元的投资，就训练出一个与ChatGPT O1相媲美的模型，其成本降低了十倍，而效果则不逊色于顶尖的大型模型。

因此，今后大家对算力的需求大幅下降。据说AMD已经将Deepseek整合进了他们的解决方案中。

曾经，所有的公司都认为，为了实现AI大模型的奇迹，需要在计算能力上进行巨额投资并采购大量芯片。然而，Deepseek颠覆了这一看法。外国人往往倾向于将问题复杂化，而中国人则擅长于简化问题。

最为重要的是：Deepseek是一个完全开源的模型，遵循MIT协议，从代码到架构、理论到训练方法均可自由查看、修改和使用。目前，全球多个团队已经宣布成功复现R1的训练过程。

报道称，研究人员后来发现，Deepseek在较深层次的推理上仍然不及西方大型模型的计算能力，只是在特定场景下其推理能力可以节省算力。

写在最后

DeepSeek的主要意义在于以较低成本揭露美国AI产业中的资本泡沫，从而使AI研究重回科学本质。同时，它通过开源方式打破了美国模型的壁垒，使全球各地的人们都能参与到AI的研发中。

难怪DeepSeek的创始人被总理接见，还登上了新闻联播。

上一篇：2024年市场规模或达1042亿元车企“开卷”硬派越野赛道

下一篇：特朗普乱挥关税大棒诺奖得主批美成“可怕的投资之地”_大皖新闻 | 安徽网