AI算力不止GPU 国产大模型有望“摆脱”英伟达？-海诗网

自ChatGPT爆火之后，AI大模型的研发层出不穷，而在这场“百模大战”激战正酣之际，美国芯片公司NVIDIA（英伟达）却凭借其GPU在大模型计算中的出色发挥赚得盆满钵满。

而就在近日，科大讯飞创始人、董事长刘庆峰表示：“华为的 GPU（图形处理器）能力现在已经跟英伟达 A100 一样了，现在已经做到对标英伟达的 A100。”

华为方面对此并没有回应，不过，多位业内人士对《中国经营报》记者表示，目前，国内在AI芯片领域已经取得了一定的成就，但要与英伟达A100相媲美，还存在一些挑战。

GPU被掣肘

英伟达在去年收到美国政府的通知，通知称：“若对中国（含中国香港）和俄罗斯的客户出口两款高端GPU芯片——A100和H100，需要新的出口许可。”不仅如此，该许可证要求还包括未来所有的英伟达高端集成电路，只要其峰值性能和芯片间I/O性能均大于或等于A100的阈值，以及包括这些高端电路的任何系统，都被纳入许可证限制范围。

不过，英伟达针对中国客户推出了替代型号A800，与原有的A100系列计算卡相比，A800系列的规格基本相同，比较大的区别在于NVLink互连总线的连接速率，A100系列为600GB/s，A800系列则被限制在了400GB/s，综合使用效率只有A100的70%左右。

但即使这样，原本7.4万元左右一枚的A800，现在也涨到10万元以上，并且“一卡难求”。

刘庆峰指出，尽管中国开发的AI算法非常强大，但国内硬件的计算能力传统上落后于英伟达。他提到了中国企业在训练AI大模型方面面临的挑战，这主要是在英伟达的硬件上完成的，企业内部只能做出微小的调优和训练。由于美国对中国超级计算机行业的限制，对英伟达硬件的依赖成为中国人工智能企业的一个主要限制。

近日，科大讯飞与华为共同发布用于构建专属大模型的软硬件一体化设备“星火一体机”让国内的大模型厂商再燃希望。刘庆峰表示，华为在GPU领域取得了重大进展，实现了与英伟达A100 GPU相当的能力和性能。

对此，华为方面并未作出回应。不过，记者注意到，华为并不研发GPU产品，其旗下共有昇腾310、昇腾910两款AI处理器加速器。

深度研究院院长张孝荣对记者表示，目前国内尚未有媲美英伟达A100的能力。英伟达A100是2020年一款高性能计算芯片，2023年最新GPU是H100，具有更强大的AI推理能力和超高的浮点计算性能。虽然国内厂商的GPU能力已经有所提升，但目前还远远没有达到与英伟达A100相媲美的水平。

不过，在天使投资人、资深人工智能专家郭涛看来，近几年来，我国芯片产业高速发展，在一批关键核心技术取得新突破，目前已经具备生产媲美英伟达A100芯片的能力，但若想实现大规模出货仍然面临很多挑战。

全联并购公会信用管理委员会专家安光勇也认为，目前，国内在AI芯片领域已经取得了一定的成就，但要与英伟达A100相媲美，还存在一些挑战。英伟达A100是一款面向高性能计算和人工智能任务的GPU，具备出色的计算和训练能力，但要达到A100的水平仍需要时间。

弯道超车

“中国有很多GPU的初创公司，不要低估中国在芯片领域的追赶能力。”英伟达CEO黄仁勋曾表示。

虽然距离国内厂商赶超英伟达尚有较大的距离，但AI芯片并非只有GPU。

AI场景需要多核、高并发、高带宽的AI芯片。AI芯片，也被称为AI加速器或计算卡，即专门用于处理人工智能应用中的大量计算任务的模块。当前，AI芯片主要分为GPU 、FPGA（现场可编程门阵列），及以TPU、VPU为代表的ASIC（特定应用集成电路）芯片。

FPGA属于具备可编程硬件结构的集成电路，其可编程性和灵活性可快速适应不同AI算法要求，但也存在高功耗的问题。ASIC属于专用芯片，通过算法固化实现更高的算法利用率和能耗比，但开发周期较长、灵活性较弱。

郭涛表示，中国在AI芯片领域的研发和生产方面已经取得了一些重要成果，除GPU芯片外，未来有望在CPU（中央处理器）、FPGA芯片、ASIC芯片等多个方面实现弯道超车。

张孝荣也认为，除了GPU之外，国内厂商还可以研发其他类型的加速器，如FPGA、DSP等。这些加速器可以针对特定的AI计算任务进行优化，提高计算效率和性能。除此之外，还可以通过优化算法和模型设计，减少对计算资源的依赖，提高计算效率。例如，剪枝、量化等技术可以减少模型的参数量和计算量。将AI计算能力下沉到设备端，减少对云端计算资源的依赖。通过在设备端进行本地计算，可以提高响应速度和数据隐私保护。总之，国内可以通过不断创新和技术积累，在AI芯片领域有所创新，不要着眼于不切实际的弯道超车，而要以满足实际需求为主，逐渐缩短GPU领域的差距。

安光勇表示，国内致力于发展本土芯片产业，通过政策和资金支持，促进产业生态的形成，这将有助于国内企业在芯片领域进行合作和创新。不仅如此，中国在人工智能算法和应用方面也有很强的优势。即使在芯片技术上难以迅速迎头赶上，通过优化算法和软件，仍可以在性能和效率上取得优势。

实际上，国内的厂商也在不断实现突破。“当前中国大模型中有一半是由华为昇腾AI来支撑的。”今年7月，华为轮值董事长胡厚崑对外透露。华为昇腾计算业务总裁张迪煊也透露，截至目前，昇腾已认证了30多家硬件伙伴、1200多家软件伙伴，联合孵化了2500多个AI场景方案。在中国，平均每两家AI企业就有一家选择昇腾。

作为“科创板AI芯片第一股”的寒武纪此前在互动平台回复，公司设计、研发的智能芯片不属于GPU，是面向人工智能领域专门设计的芯片。智能芯片的性能和能效优势主要集中于智能应用，在人工智能领域可以替代GPU芯片，但不适用于人工智能之外的其他领域。

而在“传统”的GPU领域，国内厂商也有所建树。摩尔线程全功能GPU显卡可以完成AI模型的训练、推理、精调全流程，目前可以进行ChatGLM和GLM系列模型的推理，并且支持超大大模型的分布式推理和offload推理。

量化巨头明汯被罚！回应来了