自ChatGPT爆火之后,AI大模型的研发层出不穷,而在这场“百模大战”激战正酣之际,美国芯片公司NVIDIA(英伟达)却凭借其GPU在大模型计算中的出色发挥赚得盆满钵满。
而就在近日,科大讯飞创始人、董事长刘庆峰表示:“华为的 GPU(图形处理器) 能力现在已经跟英伟达 A100 一样了,现在已经做到对标英伟达的 A100。”
华为方面对此并没有回应,不过,多位业内人士对《中国经营报》记者表示,目前,国内在AI芯片领域已经取得了一定的成就,但要与英伟达A100相媲美,还存在一些挑战。
GPU被掣肘
英伟达在去年收到美国政府的通知,通知称:“若对中国(含中国香港)和俄罗斯的客户出口两款高端GPU芯片——A100和H100,需要新的出口许可。”不仅如此,该许可证要求还包括未来所有的英伟达高端集成电路,只要其峰值性能和芯片间I/O性能均大于或等于A100的阈值,以及包括这些高端电路的任何系统,都被纳入许可证限制范围。
不过,英伟达针对中国客户推出了替代型号A800,与原有的A100系列计算卡相比,A800系列的规格基本相同,比较大的区别在于NVLink互连总线的连接速率,A100系列为600GB/s,A800系列则被限制在了400GB/s,综合使用效率只有A100的70%左右。
但即使这样,原本7.4万元左右一枚的A800,现在也涨到10万元以上,并且“一卡难求”。
刘庆峰指出,尽管中国开发的AI算法非常强大,但国内硬件的计算能力传统上落后于英伟达。他提到了中国企业在训练AI大模型方面面临的挑战,这主要是在英伟达的硬件上完成的,企业内部只能做出微小的调优和训练。由于美国对中国超级计算机行业的限制,对英伟达硬件的依赖成为中国人工智能企业的一个主要限制。
近日,科大讯飞与华为共同发布用于构建专属大模型的软硬件一体化设备“星火一体机”让国内的大模型厂商再燃希望。刘庆峰表示,华为在GPU领域取得了重大进展,实现了与英伟达A100 GPU相当的能力和性能。
对此,华为方面并未作出回应。不过,记者注意到,华为并不研发GPU产品,其旗下共有昇腾310、昇腾910两款AI处理器加速器。
深度研究院院长张孝荣对记者表示,目前国内尚未有媲美英伟达A100的能力。英伟达A100是2020年一款高性能计算芯片,2023年最新GPU是H100,具有更强大的AI推理能力和超高的浮点计算性能。虽然国内厂商的GPU能力已经有所提升,但目前还远远没有达到与英伟达A100相媲美的水平。
不过,在天使投资人、资深人工智能专家郭涛看来,近几年来,我国芯片产业高速发展,在一批关键核心技术取得新突破,目前已经具备生产媲美英伟达A100芯片的能力,但若想实现大规模出货仍然面临很多挑战。
全联并购公会信用管理委员会专家安光勇也认为,目前,国内在AI芯片领域已经取得了一定的成就,但要与英伟达A100相媲美,还存在一些挑战。英伟达A100是一款面向高性能计算和人工智能任务的GPU,具备出色的计算和训练能力,但要达到A100的水平仍需要时间。
弯道超车
“中国有很多GPU的初创公司,不要低估中国在芯片领域的追赶能力。”英伟达CEO黄仁勋曾表示。
虽然距离国内厂商赶超英伟达尚有较大的距离,但AI芯片并非只有GPU。
AI场景需要多核、高并发、高带宽的AI芯片。AI芯片,也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块。当前,AI芯片主要分为GPU 、FPGA(现场可编程门阵列),及以TPU、VPU为代表的ASIC(特定应用集成电路)芯片。
FPGA属于具备可编程硬件结构的集成电路,其可编程性和灵活性可快速适应不同AI算法要求,但也存在高功耗的问题。ASIC属于专用芯片,通过算法固化实现更高的算法利用率和能耗比,但开发周期较长、灵活性较弱。
郭涛表示,中国在AI芯片领域的研发和生产方面已经取得了一些重要成果,除GPU芯片外,未来有望在CPU(中央处理器)、FPGA芯片、ASIC芯片等多个方面实现弯道超车。
张孝荣也认为,除了GPU之外,国内厂商还可以研发其他类型的加速器,如FPGA、DSP等。这些加速器可以针对特定的AI计算任务进行优化,提高计算效率和性能。除此之外,还可以通过优化算法和模型设计,减少对计算资源的依赖,提高计算效率。例如,剪枝、量化等技术可以减少模型的参数量和计算量。将AI计算能力下沉到设备端,减少对云端计算资源的依赖。通过在设备端进行本地计算,可以提高响应速度和数据隐私保护。总之,国内可以通过不断创新和技术积累,在AI芯片领域有所创新,不要着眼于不切实际的弯道超车,而要以满足实际需求为主,逐渐缩短GPU领域的差距。
安光勇表示,国内致力于发展本土芯片产业,通过政策和资金支持,促进产业生态的形成,这将有助于国内企业在芯片领域进行合作和创新。不仅如此,中国在人工智能算法和应用方面也有很强的优势。即使在芯片技术上难以迅速迎头赶上,通过优化算法和软件,仍可以在性能和效率上取得优势。
实际上,国内的厂商也在不断实现突破。“当前中国大模型中有一半是由华为昇腾AI来支撑的。”今年7月,华为轮值董事长胡厚崑对外透露。华为昇腾计算业务总裁张迪煊也透露,截至目前,昇腾已认证了30多家硬件伙伴、1200多家软件伙伴,联合孵化了2500多个AI场景方案。在中国,平均每两家AI企业就有一家选择昇腾。
作为“科创板AI芯片第一股”的寒武纪此前在互动平台回复,公司设计、研发的智能芯片不属于GPU,是面向人工智能领域专门设计的芯片。智能芯片的性能和能效优势主要集中于智能应用,在人工智能领域可以替代GPU芯片,但不适用于人工智能之外的其他领域。
而在“传统”的GPU领域,国内厂商也有所建树。摩尔线程全功能GPU显卡可以完成AI模型的训练、推理、精调全流程,目前可以进行ChatGLM和GLM系列模型的推理,并且支持超大大模型的分布式推理和offload推理。