1月30日,AMD全球副总裁David McAfee在X平台分享了一张对比图,展示了AMD Radeon RX 7900 XTX显卡在运行DeepSeek-R1 AI模型时,与英伟达RTX 4090和RTX 4080 SUPER的性能差异。测试结果显示,RX 7900 XTX在运行较小体量的模型时,性能超过RTX 4090,最高领先幅度达13%,且全面领先RTX 4080 SUPER。
AMD官方还提供了关于如何在AMD硬件上使用DeepSeek R1模型的说明,并列出了不同型号显卡支持的DeepSeek R1模型参数体量。用户需确保显卡驱动版本为Adrenalin Edition 25.1.1或更高版本,并安装LM Studio 0.3.8或更高版本。
#AMD #显卡 #DeepSeek #人工智能 #英伟达
AMD近日宣布,已将优化的DeepSeek-V3模型集成到Instinct MI300X GPU上,显著提升AI推理性能。DeepSeek-V3是此前最强的开源大型语言模型(DeepSeek-R1是目前最强的开源大型语言模型),采用混合专家(MoE)架构,总参数量达6710亿。
通过SGLang的强化优化,DeepSeek-V3在发布首日即可在AMD GPU上运行。AMD的ROCm平台支持FP8浮点格式,减少内存瓶颈和延迟,提升训练和推理效率。
这一集成在文本生成、视觉识别和自然语言处理等领域展现了强大潜力,为AI开发带来新突破。
#AMD #DeepSeek #人工智能 #SGLang #商业