难怪DeepSeek的创始人被总理接见,还登上了新闻联播!

发布日期:2025-02-05 13:12    点击次数:192


Deepseek恐怕做梦都没料到,一个业余的AI团队,转眼间竟已与华为、TikTok 比肩齐名了。这家成立于2023年的的AI公司Deepseek先是在外网火了,许多人预言:Deepseek很可能会戳破美国史上最大的AI泡沫。

这两天,总理邀请 Deepseek 创始人梁文锋参加座谈会,相关报道更是登上《新闻联播》,一时间引发广泛关注。

随后,微软的总裁纳德拉、扎克伯格以及OpenAI的创始人奥特曼都对Deepseek表示赞赏。整個美國的AI界也在关注Deepseek推出的V3和R1大模型。

扎克伯格直接表示,他呼吁美国政府尽快限制中国的AI技术,并指出Deepseek对美国国家安全构成威胁。他要求所有AI领域的员工积极参与研究Deepseek的大模型。

扎克伯格感到焦虑,因为支撑Meta公司股价的正是占据市场优势的开源LLaMA模型。这一模型的投入已超过1000亿美元,原本还打算再投资650亿美元以建立护城河,但结果Deepseek只用了一位Meta高管的薪资,就成功开发出超越他们多年来花费上千亿研发出的开源LLaMA模型。

最关键的是对方的主要业务是进行“量化交易”,后面又开展了一个副业——AI大模型,结果竟然威胁到了美国的国家安全。你说扎克伯格能不着急吗!!!

Meta公司最初的目的是希望通过开源的LLaMA模型,广泛掌控全球商业领域,甚至能够借助AI技术来影响各个公司的生产力水平,使其开源模型在AI时代如同水电一般不可或缺。

Deepseek推出后,扎克伯格惊呆了,不仅导致英伟达的股价下滑,还有可能打击美国历史上最大的AI泡沫。

Deepseek改变了整个AI大模型的研发方式。在发布后,Deepseek仅利用了一小部分芯片和不到600万美元的投资,就训练出一个与ChatGPT O1相媲美的模型,其成本降低了十倍,而效果则不逊色于顶尖的大型模型。

因此,今后大家对算力的需求大幅下降。据说AMD已经将Deepseek整合进了他们的解决方案中。

曾经,所有的公司都认为,为了实现AI大模型的奇迹,需要在计算能力上进行巨额投资并采购大量芯片。然而,Deepseek颠覆了这一看法。外国人往往倾向于将问题复杂化,而中国人则擅长于简化问题。

最为重要的是:Deepseek是一个完全开源的模型,遵循MIT协议,从代码到架构、理论到训练方法均可自由查看、修改和使用。目前,全球多个团队已经宣布成功复现R1的训练过程。

报道称,研究人员后来发现,Deepseek在较深层次的推理上仍然不及西方大型模型的计算能力,只是在特定场景下其推理能力可以节省算力。

写在最后

DeepSeek的主要意义在于以较低成本揭露美国AI产业中的资本泡沫,从而使AI研究重回科学本质。同时,它通过开源方式打破了美国模型的壁垒,使全球各地的人们都能参与到AI的研发中。

难怪DeepSeek的创始人被总理接见,还登上了新闻联播。




Powered by 11选五有万能8码吗 @2013-2022 RSS地图 HTML地图