AI芯片之争正在升温。
7月11日,英特尔针对中国市场推出了AI芯片Habana Gaudi 2。 Gaudi 2直接与Nvidia 100系列GPU竞争,争夺AI算力市场的王座。
众所周知,目前GPU资源紧缺,英伟达100系列在国内被禁,百模大战下对算力的需求仍在飙升。 就中国市场而言,迫切需要AI芯片“解渴”。 对于英特尔来说,当前算力短缺的窗口期也是绝佳的出击时机。
英特尔还强调,Gaudi 2芯片是专门为训练大型语言模型而打造的,采用7纳米工艺,拥有24个张量处理器核心。 事实上,英特尔去年在海外发布了Gaudi 2,这次在国内推出了“中国特别版”。
由于各国出口管制限制,外界首要关注的是中国市场AI芯片供应的可持续性。 对此,英特尔公司执行副总裁、数据中心与人工智能事业部总经理桑德拉·里维拉在接受21世纪经济报道记者采访时给出了肯定的答案。
Sandra Rivera表示:“这款卡也是在中国定制的产品,出口或支持中国客户没有问题。英特尔必须继续合法合规地支持我们在中国的客户,无论是Gaudi 2还是Gaudi 2。”未来的高迪3,我们必须做一些符合法律法规的中国定制产品,满足中国客户的需求。”
与此同时,芯片的性能并没有打折扣。 她说:“在网速方面,与国际版相比,(中国版)从24个网口变成了21个网口,但整体性能基本相同。”
近几个月来,随着更大的型号日新月异,英特尔继续围绕 Gaudi2 进行优化。
Sandra Rivera表示,在性能方面,根据机器学习和人工智能开放产业联盟MLCommons在6月底发布的AI性能基准MLPerf Training 3.0的结果,Gaudi 2是唯一的除了 Nvidia 产品之外,还可以运行 MLPerf GPT 3.0 模型。 筹码。
发布会上,Intel还直接将Gaudi2与Nvidia的A100进行了对比,其野心可见一斑。 根据英特尔公布的数据,从计算机视觉模型训练到1760亿个参数的BLOOMZ推理,Gaudi 2的每瓦性能约为A100的两倍,模型训练和部署的功耗降低了约一半。
同时,英特尔高管还介绍,与A100相比,Gaudi 2在价格上更具竞争力,性能也更高。 接下来的9月,搭载FP8软件的Gaudi 2预计将提供比H100更高的性价比。
总体而言,除了芯片之外,在本次发布会上,英特尔展示了一系列支持大型机型的算力解决方案系统,具体落地应用和产品迭代状况也将受到关注。
一方面,目前在中国市场,英特尔已与浪潮信息、H3C、超融合等国内主要服务器厂商合作。 其中,浪潮信息NF5698G7是专为生成式AI市场设计的全新AI服务器,支持8个OAM的高速互联Gaudi2加速器,而在终端客户方面,Sandra Rivera表示:“中国市场对人工智能解决方案的需求“我们的实力非常强大,而且我们正在和几乎所有传统客户进行谈判。我们的云服务提供商和通信服务提供商都是企业客户,因此对AI解决方案的需求非常强烈。”
另一方面,在产品路线上,Intel近年来一直在强调XPU,即多样化、多组合的异构计算。 在AI相关产品线中,既有集成AI加速器的CPU处理器、GPU产品,也有以Habana Gaudi系列为代表的ASIC型AI芯片。
Habana Labs成立于2016年,主要研发方向为人工智能、深度学习计算等,创业初期获得英特尔投资,并于2019年12月正式被其以20亿美元收购。
对于GPU与AI芯片的结合,Sandra Rivera透露:“Gaudi是人工智能加速的专属产品。在Intel的产品中,如果针对大型模型的工作负载,它是性能最好的产品。明年我们还将发布下一代产品Gaudi 3。2025年,我们将Gaudi的AI芯片与GPU路线图结合起来,推出集成度更高的GPU产品。”
大机型的普及持续带动AI芯片的需求。
Sandra Rivera告诉21世纪经济报道记者:“在回顾4月份第一季度的情况时,我们看到包括高迪在内的各种人工智能带来的芯片需求,需求至少翻了一番。”
根据TrendForce向21世纪经济报道记者提供的数据,目前AI服务器主要搭载NVIDIA A100、H100、AMD MI300,大型CSP厂商如Google、AWS等自研ASIC增长较为强劲。要求。 服务器出货量(包括配备GPU、FPGA、ASIC等的服务器)预计接近120万台,年增长率接近38%。 AI芯片出货量也看涨,预计增长50%以上。
芯片厂商也在AI领域发力。 不用说,英伟达目前无论是100系列还是800系列都供不应求,在AI芯片市场拥有先发优势; 6月中旬,AMD推出了新一代AI芯片、数据中心CPU和DPU。 Instinct MI 300X直接与Nvidia H100竞争; 此外,谷歌、亚马逊、百度等各大厂商也在研发自己的AI芯片,算力市场的竞争维度更加丰富。
除了硬件之外,软件也同样重要。 例如,目前大多数AI芯片都无法绕过Nvidia的CUDA平台。 CUDA建立了一套软件和硬件之间的开发标准。 如何从CUDA迁移,如何建立自己的优势生态,是挑战者的重要课题。
对于软件生态的竞争,Sandra Rivera表示:“软件开发或者说开发者生态其实一直是英特尔多年来的强项。在整个数据中心领域的软件生态中,一个是x86软件生态,一个是x86软件生态。” “CUDA 就是 CUDA。我们注意到,随着越来越多的公司寻求使用人工智能,软件生态系统正在加速释放更多硬件潜力,从而大幅提高生产力。”
她进一步谈到:“英特尔希望在多语言环境下提供更简单的应用程序。通过软件、库和工具提供模块化方法,以优化和加速跨多种架构的异构工作负载。当然,当谈到人工智能或AI计算时,许多人们确实在使用 CUDA,但大多数开发者并不会进行如此底层的开发。他们在相对较高的框架上进行创新,例如 PyTorch 和 TensorFlow。”
Habana Labs 首席运营官 Eitan Medina 进一步向 21 世纪经济报道记者指出:“在 Gaudi2 之前,我们已经有了一代产品,我们已经积累了几年的软件,底层软件库已经开发出来。”我们希望让开发者能够在前20%中做他的开发,而这里的开发与CUDA没有那么直接的关系。”
Gaudi系列是Intel AI的旗舰,外界也在拭目以待Gaudi 2在实际应用中的性能和算力。 从硬件迭代到软件生态,AI芯片的竞争故事还将继续。
开户炒股享福利,6.XX%新客户理财,盘前信号灯工具为您服务,一对一指导服务!
海量信息,精准解读,尽在新浪财经APP
搜虎网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。