胡思乱想录二十七 - Deepseek解读

打印 被阅读次数

      春节期间被Deepseek霸屏了, 每一块液晶屏上都是国产AI的劲爆新闻,媒体挣流量的本质体现的淋漓尽致,可能对皮衣黄早有不满的华尔街更是趁火打劫,NVDA跳水16%,对AI股大有要开类似本世纪初互联网泡沫崩塌的第一枪的架势。国内更是吹上了天, 将其上升到国运级别,国人终于可以在AI竞赛中扬眉吐气了一把。

     于是尝试读了一下deepseek的论文,并没有基础架构的创新(仍基于transformer),但在微架构上的尝试和创新的确值得赞誉(MLA,不用SFT等),在没有算力支撑的情况下,看得出来他们花了很多力气尝试达到四两拨千斤的效果,结果非常reasonable。

    deepseek的训练是否真的只花了5百万美金是个问号, 本人想起若干年前在某初创公司花费三个多月做个了个DSP仿真器,因此对该架构了如指掌,后续公司新买了个EDA计工具,由于对要做什么非常清楚,用那个工具一周完成了一个和自己从零做的同样仿真器, 于是成了该EDA公司的成功案例模版,在外面到处吹其客户一周完成DSP仿真器设计,显然没有前面那三个月,何来那一周?有报道称deepseek的母公司几年前就聚集了万张显卡做machine learning(用于量化炒股),没有那些积累,估计也不会有什么五百万美金训练处frontier模型的神话。

  deepseek用到的trick,openai或anthropic他们是不懂怎么做吗?我认为也未必,只是如果如Altman所言, Scaling Law还远未结束,他们认为这是触手可得的成果和路径,所谓low hanging fruit,又没什么芯片管制,于是资源都朝着堆算力方向投去。今天看到Mark Chen的推,言下之意,deepseek的部分算法和openai是不谋而合,说明openai内部也许已经知道训练的成本可以降下来,但作为AI标杆初创,降本显然不是他们需要吹嘘的。 至于 deepseek的模型是否有缺陷呢?其实都不知道,还是让子弹飞一会儿最佳。

西岸-影 发表评论于
至于楼下
Matador 发表评论于 2025-01-30 03:03:59
共慘黨制度下發展出的人工智慧,應該也是被植入了思想禁區,共慘黨永遠是偉大,光明,正確。不能批評挑戰共慘黨,共慘黨永遠是正確的。
——-
这是对于AI的作用是什么根本不清楚的表现,属于世界观问题。
AI是人类的工具,不是反应和表现人类的主观需求。而政治是关于人类的主观需求,你认为共产党应该挑战,有人认为共产党做的不错,解决了世界上二十亿人的贫困问题(不仅仅是中国),把中国十四亿人中的五亿人带到了欧盟的平均生活水平,这是目前还没有其他政府和国家做到的。整个欧盟只有五亿人口。
这完全是出于不同的认知和思维角度,也是不同的世界观决定的。
你会让一个扳手选择是拧革命的螺钉,而不是拧反革命的螺钉?你试试在美国的ChatGPT或者不论什么AI工具问关于以色列加沙战争不利于以色列的问题,或者任何不利于以色列的政治有关的问题,你看会是什么结果。
在美国你得先有敢提这类问题的胆子,不论是对人还是对机器。

西岸-影 发表评论于
这件事情如今损失最大的是openAI的研究人员,因为DeepSeek使用的技术他们也有过涉猎,但因为不允许开源,所以不能发表论文,结果如今被DeepSeek抢先发表论文了。
这是技术角度,经济角度的冲击太大了,因为彻底破坏了美国希望利用AI垄断,建成Stargate敛钱的赢利模式,而这正是中国把不论什么都做成白菜价的目的,不允许美国垄断,利益均沾。
美国对AI的投入这么多年来已经14万亿美元,等于美国一半的GDP,开始进入收获季节,这是建立Stargate计划的主要目的,利用这些巨大的运算中心和数据中心,加上专门的核电站提供支持算力的电力,对全世界所有使用美国AI技术的人收费,月收入可能就是数千亿到上万亿。
如今DeepSeek的出现表明这种模式没意义,也就挣不到钱,因为任何国家有意进入AI领域的公司都可以使用DeepSeek自己做API建立需要的AI应用系统,基本免费,而不需要从美国获得Stargate的注册。
所以美国媒体的评论是中国这个产品的出现让AI实现民主化了,而不是美国的独裁。
14万亿美元的数年投资打水漂,这才是如今这件事的核心问题。
而不是DeepSeek具体使用了什么技术,毕竟对于投资来讲,看的是结果,而不是过程。目前知道DeepSeek的深度探索整个公司只有一百零几个人,成立没几年,但集中了一批如今二十几岁从中学时代就开始拿奖的各类天才,包括语言和历史方面的,公司号称中国五十个最聪明的人他们拥有几个。
中国把什么都做成白菜价的模式其实是对美国传统上利用垄断对技术和市场控制获得巨额利润模式的冲击,客观上有利于技术进步,你不能依赖垄断,而是不得不继续创新才能获得市场。
DeepSeek目前具有的优势是还是处于发展阶段,不需要考虑盈利,这是美国在AI竞争上处于很不利的地方,14万亿美元的投入希望看到结果。
这就能理解为什么美国市场反应这样大,和所有AI有关的公司都进入疯狂状态,董事会看着自己的钱有可能打水漂。
其实DeepSeek具体化了多少钱,用了什么芯片训练,算法是什么,都不那么重要了,这是开源,任何人都可以拷贝开发。而是看结果,手机上谁都可以下载使用,虽然因为网络攻击让deepseek停止了中国以外的注册,但用谷歌账户仍然可以登录使用。
而且免费。这东西在日常生活中是真省时间,更别说工作中了。

Matador 发表评论于
共慘黨制度下發展出的人工智慧,應該也是被植入了思想禁區,共慘黨永遠是偉大,光明,正確。不能批評挑戰共慘黨,共慘黨永遠是正確的。
登录后才可评论.