加拿大pc28官网规则 AMD晓示集成DeepSeek-V3到MI300X GPU,它能否与英伟达抗衡?

发布日期:2025-01-09 13:30    点击次数:109

在东说念主工智能芯片这场角力中,凭借其强大的技艺实力和完好的生态系统,构筑起了一起确实难以进步的壁垒。可是,跟着 AI 应用场景的络续推广,相配是在推理阶段的需求爆发,AMD 等竞争者正在寻找突破口,试图在这场竞争中获得一隅之地。

最新讯息自大,AMD 收拢了 DeepSeek 模子最近走红的机会,晓示已将新的 DeepSeek-V3 模子集成到 Instinct MI300X GPU 上。这一集成旨在与 SGLang 配合使用,以收场最好性能。DeepSeek-V3 很是针对 AI 推理进行了优化,这标明 AMD 正在积极布局 AI 应用落地场景。

这一合作背后,所反应的亦然 AI 行业方法的变化。当年两年,大模子的涵养需求主导了算力市集,英伟达凭借 CUDA 生态和 H100 系列 GPU 占据十足上风。但跟着大模子参预应用落地阶段,推理需求激增,企业更柔软资本、能效和部署生动性。AMD 正对准这一窗口期,试图通过优化推感性能冲突英伟达的左右。

AMD 的 AI 芯片之路

AMD 的 Instinct MI300X 是当年其 AI 策略的中枢火器。这款承袭 Chiplet 设想的 GPU 集成 1460 亿晶体管,配备 192GB HBM3 内存,专为大限度 AI 推理设想。据 AMD 数据,MI300X 的推感性能较英伟达 H100 提高 30%,内存带宽达 5.3TB/s,尤其擅长及时对话、图像生成等低蔓延任务。可是,MI300X 的引申面对两大挑战:生态短板与产能瓶颈。

英伟达的 CUDA 生态已变成近乎左右的诱导者壁垒,各人 90% 的 AI 框架依赖其器具链。尽管 AMD 推出开源的 ROCm 平台并适配 PyTorch、TensorFlow,但迁徙资本高、社区复旧不及的问题依然杰出。举例,Meta 虽承袭 MI300X 运行 Llama 3.1 模子的推理任务,但涵养阶段仍依赖英伟达芯片。此外,2023 年底台积电先进封装产能病笃导致 MI300X 托福蔓延,部分客户转投英伟达,也暴泄露 AMD 在供应链不停上的脆弱性。

为应酬挑战,AMD 加快硬件迭代并强化生态合作。2024 年 6 月,AMD 推出了升级版的 MI325X 芯片,这款产物承袭了 8 个筹划芯片、4 个 I/O 芯片和 8 个内存芯片的复杂设想,通过 2.5D 和 3D 封装技艺收场整合。在性能方面,MI325X 提供了 1.3 petaFLOPS 的 BF/FP16 性能,或 2.6 petaFLOPS 的 FP8 性能,卓著了英伟达的 H200。相配是在内存容量上,MI325X 配备了 288GB 的 HBM3e 内存,是 H200 的两倍多,内存带宽达到 6TB/S。

但 MI325X 依旧存在光显短板。与英伟达的产物比较,AMD 在 FP8(8 位浮点数)复旧方面存在弱势。由于软件库 vLLM 对 FP8 复旧有限,AMD 不得不在好多基准测试中使用 FP16,这意味着换取限度的 AI 模子在 AMD 芯片上需要更多内存。

面对这些技艺挑战,AMD 也曾打算了明确的产物门道图。AMD 指标 2025 年推出 MI355X,性能较 MI325X 再提高 80%,并承袭 3nm 工艺。但更遑急的是,AMD 还表现了代号为“CDNA next”的下一代产物将带来“紧要架构升级”,可能包括异构多芯片部署或光子内存推广等改变技艺,且将复旧 FP4 和 FP6 数据类型,这一更正有望处置现在在低精度筹划方面的短板。

构建全宗旨 AI 生态系统

按照赛程安排,WTA布里斯班500赛将在12月29日开打,世界第一萨巴伦卡领衔参赛阵容。

在技艺改变除外,AMD 还通过一系列策略投资来加强其在 AI 范畴的竞争力。

2024 年 7 月,AMD 以 6.65 亿好意思元收购欧洲最大私东说念主 AI 践诺室 Silo AI。这家践诺室领有 300 名各人,在诱导定制化大讲话模子和 MLOps(机器学习运维)器具方面具有深厚积存。这次收购灵验补强了 AMD 的 AI 作事智商:Silo AI 莽撞为客户提供从模子涵养到部署的全进程复旧,而 AMD 则不错借此将硬件、软件和作事整合为完好的“端到端处置决策”。值得一提的是,Silo AI 为欧洲企业诱导的“主权 AI”模子(如复旧欧盟多讲话的 Poro 和 Viking)也曾收场了在 AMD 平台上的径直运行,这将为 AMD 在欧洲市集构建起特有的区域性上风。

2024 年 12 月,AMD 领投了 MIT 初创公司 Liquid AI 的 2.5 亿好意思元 A 轮融资。Liquid AI 提倡的“液态神经网罗”(Liquid Neural Network)甩掉传统 Transformer 架构,效法线虫神经系统设想动态权重更新机制。其模子 LFM-1B 在职务中,以 1/10 的参数目达到同等限度模子的性能,且推理能效提高 90%。这一技艺有望处置 Transformer 在长序列建模和边际筹划中的瓶颈。AMD 的押注不仅是为了霸占下一代 AI 架构的先机,亦然为了在英伟达主导的“大模子武备竞赛”外开辟新战场。

2025 年 1 月,AMD 又以 2000 万好意思元投资 AI 制药公司 Absci,初次进犯人命科学范畴。Absci 诈骗 AI 从新设想抗体,传统药物研发需 10-15 年,而借助 AMD 的 MI300X 芯片,其“集成药物创造平台”可将抗体设想周期裁汰至 6 周。AMD 看中的是人命科学范畴对高效推理的需求——基因测序、卵白质模拟等任务需要海量并行筹划,而英伟达在该市集的布局尚未变成壁垒。与 Absci 合作,将匡助 AMD 扩大芯片应用场景,还可积存生物筹划范畴的专属优化教学。

可是,挑战依然存在。正如行业分析师指出的,尽管 AMD 等公司在某些弊端 AI 任务上莽撞提供更快的速率和更低的价钱,但英伟达的上风仍然光显。英伟达 CEO 曾自信地表现,即使竞争敌手的芯片免费提供,从总领有资蓝本看也无法与英伟达竞争。这种底气源自英伟达在 AI 软件生态系统和合座处置决策方面恒久建立的上风地位。

另一方面,亚马逊、谷歌等云厂商自研 AI 芯片(如 Trainium 2、Trillium)也在握续挤压第三方供应商的空间。此外,地缘政事风荆棘遏疏远——好意思国对华芯片出口为止也在迫使 AMD 出动中国市集策略,而英伟达凭借更早的各人化布局(如与沙特合作建树 AI 数据中心)或更具韧性。

不外,市集方法正在发生变化。跟着 AI 芯片的主战场从涵养向推理阶段飘动,性价比和能效比将变得越来越遑急。好意思国德克萨斯高档筹划中心等机构也曾运转探求在推理任务中使用替代决策,原因是英伟达芯片的价钱和能耗齐相对较高。这为 AMD 等竞争者提供了机会。

在接受《期间》杂志采访时,AMD CEO 苏姿丰表现,AI 不是好景不常的泡沫,而是一个紧要的技艺变革机遇。她强调,AMD 的上风在于莽撞提供端到端的 AI 处置决策,并在与合作伙伴衔尾方面施展出色。这种策略想维反应在 AMD 的投资布局上,从芯片研发到软件优化,从东说念主才储备到应用场景拓展,AMD 正在构建起全宗旨的 AI 生态系统。

瞻望将来,诚然短期内难以撼动英伟达的主导地位,但跟着 AI 应用场景的络续丰富和市集需求的握续增长,AMD 通过技艺改变和策略投资,正在逐步削弱与诱骗者的差距。在这场技艺变革中,最终的赢家可能不是单一的左右者,而是莽撞为不同应用场景提供最优处置决策的参与者。

参考贵寓:

1.https://x.com/AMD/status/1882851449991737473

2.https://time.com/7026241/lisa-su-amd-ceo-interview/

3.https://www.theregister.com/2024/06/03/amd_reveals_refreshed_mi325x_with/

4.https://technologymagazine.com/articles/how-amd-is-intensifying-ai-chip-focus-amid-global-tech-race

5.https://www.tomshardware.com/tech-industry/artificial-intelligence/amd-reveals-core-specs-for-instinct-mi355x-cdna4-ai-accelerator-slated-for-shipping-in-the-second-half-of-2025

排版:刘雅坤