首页 排行 分类 完本 书单 用户中心
搜书趣 > 都市 > 学霸的征途是星辰大海 > 第301章 真理的启迪者 三

学霸的征途是星辰大海 第301章 真理的启迪者 三

簡繁轉換
作者:见习人类观察员 分类:都市 更新时间:2026-05-31 22:13:29 来源:源1

稍微适应了一下升级后的大脑,徐辰估摸着DeepSeek的论文应该是发出来了。

(请记住台湾小説网→??????????.??????网站,观看最快的章节更新)

他打开电脑,熟练地登录arXiv,输入了关键词。

果然,那篇论文赫然在列。

徐辰在公寓里下载了这篇论文,仔细研读了一遍。

论文的核心原理极其惊艳,直击当前大语言模型(LLM)的软肋:现有的Transformer架构虽然通过MoE(混合专家)实现了「条件计算」,但缺乏原生的知识查找机制。

当模型需要回忆一个静态事实的时候,比如「巴黎是法国的首都」,它只能通过消耗宝贵的注意力机制和前馈网络层去「重新计算」和「模拟提取」。这就像是让一个顶级数学家去死记硬背电话号码,极大地浪费了推理算力。

而DeepSeek给出的解法,正是「条件记忆」。

他们引入了一个名为「Engram(记忆印迹)」的模块,将经典的N-gram嵌入现代化,实现了O(1)时间复杂度的常数级知识查找。简单来说,模型不再需要死记硬背,而是学会了「查字典」。

论文中还提出了一条「U型缩放定律」,证明了将大约20%到25%的稀疏参数分配给Engram模块时,模型性能达到最优。更恐怖的是,由于Engram的查找是确定性的,它完全可以绕开昂贵的GPU显存(HBM)限制,直接从廉价的主机内存(DRAM)中进行运行时预取,几乎没有额外的性能开销。

「干得漂亮。」

徐辰看着论文里的架构图,暗自点头。

以他升级后的信息学LV2的眼光来看,梁文锋的这个成果,和系统当初给出的那个完美的D-LTMN方案相比,其实做了一些工程上的妥协。

系统方案更偏向于底层硬体架构的微调,而DeepSeek则是在现有的GPU集群和Transformer框架下,做到了软体层面的极致压榨。

「这算是……系统方案的『青春版』?」

徐辰摸了摸下巴。

但这已经足够惊艳了。

不出意外,这篇论文将在接下来的几个月里,成为整个AI界讨论的焦点。

……

徐辰猜得没错。

此时的曼哈顿下城,摩根史坦利大楼。

高级分析师约翰·史密斯正对着电脑屏幕发呆,手里那杯昂贵的冷萃咖啡已经在那儿摆了半个多小时,冰块化了一半,也没动一口。

屏幕上是一份还没写完的研报草稿——《英伟达:算力帝国的黄昏还是黎明?》。

约翰感觉自己的头发都要掉光了。

现在的华尔街,简直就是个精神分裂的疯人院。

一方面,整个美股全靠那几只科技巨头撑着,尤其是英伟达,简直就是全村的希望。只要AI的故事还在讲,只要大模型还需要烧钱买卡,纳斯达克就能接着创新高,大家的年终奖就有着落。

如果英伟达倒了,AI泡沫破裂,美股大盘就会瞬间崩盘,引发系统性的金融危机。到那时,不仅他的饭碗保不住,整个华尔街都要排队去跳楼。

所以,上头的指令很明确:「看多!必须看多!不能让泡沫破了!」

但另一方面,现实的数据却像是一记记响亮的耳光。

年初那个中国小子搞出来的SLRM架构,已经让训练端对GPU的需求砍了一半。现在好了,DeepSeek又搞出了个Engram,直接在推理端把显存需求给废了!

「这日子没法过了……」

他在研报里敲下了一段极其纠结的文字:

【……我们注意到,近期来自中国研究团队的SLRM架构与Engram模块,在优化大语言模型(LLM)的KVCache显存占用及推理计算量方面取得了显着进展。这表明,在纯文本推理端,算力边际成本递减的趋势正在加速。】

【基于DCF(现金流折现)模型及对未来三年TAM(总潜在市场)的重新评估,我们预计北美四大云服务商(CSP)在纯文本推理端的Capex(资本支出)增速将出现拐点。Engram架构的O(1)常数级查找特性,实质上打破了『显存墙』的物理限制,导致单Token的算力与显存成本呈断崖式下降。因此,我们将英伟达2026财年的营收预期下调12%,目标价由145美元下调至115美元。】

写完这段,约翰又觉得太悲观了,可能会被老板骂「唱空美股」。

于是他又加了一句找补的话:

【当然,如果考虑到未来AI应用场景的爆发式增长,市场总需求的急剧膨胀将完全对冲单Token算力成本下降带来的负面影响,英伟达的算力护城河依然深不可测。因此,我们维持『增持』评级。】

看着屏幕上这段文字,约翰自己都觉得滑稽。

一边大幅下调目标价,一边又给出「增持」评级,这简直就是**裸的精神分裂!

但是作为华尔街的分析师,他根本没办法。

他既要闭着眼睛吹捧美国AI产业蒸蒸日上,以保住当前脆弱的股市大盘和自己的饭碗;又要面对英伟达不断累积的产业崩盘风险,在研报里留下足够的「免责声明」,免得日后泡沫破裂时被愤怒的投资者起诉欺诈。

其实,不仅仅是华尔街,现在的美国到处都在上演着这种「精神分裂」的荒诞剧。比如华盛顿那帮政客,美联储一边声嘶力竭地喊着维持高利率抗击通胀,财政部一边却又在疯狂发债印钞,往市场里大肆放水。

这种极度拧巴的现象,归根结底,核心矛盾只有一个——美国的真实科技与金融实力已经开始不可逆地衰退,但为了维持全球霸权,外部的宣传和资产定价却必须死死撑住,绝不能露出半点疲态。

里子已经千疮百孔,但面子还得硬撑。这就是约翰,也是整个华尔街此刻面临的死局。

……

然而,就在华尔街还在纠结怎麽「圆谎」的时候,有人已经动手了。

对于幻方量化(DeepSeek母公司)的交易团队来说,技术突破不仅仅意味着**文,更意味着——暴利。

早在论文发布的前一周,他们就已经通过复杂的期权组合,在离岸市场上悄悄建立了大量的英伟达空头头寸。

当论文发出的那一刻,也就是收网的时候。

纳斯达克开盘。

英伟达(NVDA)的股价,在盘前交易阶段就跳空低开了5%。

开盘后,更是如自由落体般一路向下,短短半小时内蒸发了近千亿美元的市值。

交易大厅里,哀鸿遍野。

「该死!DeepSeek这帮人简直是强盗!」

一个交易员愤怒地摔了键盘,「他们一边**文砸盘,一边在期权市场上做空!这简直是降维打击!技术碾压就算了,金融手段也这麽狠!」

「听说幻方那边的空单已经翻了三倍了!这帮搞量化的,简直比抢银行还快!」

恐慌情绪迅速蔓延。

原本还在观望的机构纷纷抛售,英伟达的股价一度跌破了关键支撑位。

几位交易员瘫坐在椅子上,不禁发出了灵魂拷问:

「上帝啊,到底谁才是科技强国?到底谁才是金融强国?」

「我们建了那麽复杂的金融衍生品,不就是为了收割全世界吗?怎麽现在反过来被中国人用技术加金融的双重手段给收割了?这剧本不对啊!」

……

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报