天才一秒记住【权七小说】地址:https://www.quanqihao.com
与此同时,圣克拉拉,英伟达总部。
黄仁勛正穿著他那件標誌性的皮衣,在会议室里来回踱步。
他的面前,同样摆著那篇论文。
“你们怎么看?”
老黄停下脚步,目光如电,扫视著在座的技术高管。
“jensen(黄仁勛英文名),这个算法对我们的cuda生態是个挑战。”
一位首席架构师面色凝重,“它大量使用了min、max这种非线性算子,而且数据依赖性很强,无法像矩阵乘法那样进行大规模並行流水线优化。
在h100上跑这个,sm单元的利用率可能连20%都不到。”
“也就是说,我们的显卡,在这个算法面前,变成了『废铁?”
老黄的声音很冷。
“不能说是废铁,但確实……性价比极低。”
老黄沉默了。
作为“ai军火商”
,他最怕的不是竞爭对手,而是“技术路线的变更”
。
英伟达之所以能躺著赚钱,是因为全世界都在用transformer,都在做矩阵乘法。
他只要把矩阵乘法做到极致,就能垄断市场。
但现在,有人想换个玩法。
这才是英伟达最担心的事情。
英伟达的护城河,从来不仅仅是硬体性能,而是cuda生態。
数百万开发者习惯了调用cublas、cudnn这些高度优化的库来构建模型。
如果一种新算法绕过了这些库,甚至需要全新的硬体支持,那么英伟达的垄断地位就会出现裂痕。
“amd那边有什么动静?”
老黄问道。
“mi300系列的架构比较灵活,他们在標量计算单元上保留了更多的资源,理论上跑slrm会比我们稍微从容一些。”
技术部主管回答,“而且,他们最近在积极接触pytorch团队,试图推动对非矩阵算子的原生支持。”
“不能给他们机会。”
老黄的眼神变得冷峻。
他走回座位,双手撑在桌面上,下达了一系列指令。
“第一,软体层面。
立即启动cuslrm项目。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!