摘要
-
随着人工智能技术的加快速度进行发展,对计算能力的需求日渐增长,传统计算架构已不足以满足需求,因此
产品介绍
随着人工智能技术的加快速度进行发展,对计算能力的需求日渐增长,传统计算架构已不足以满足需求,因此新型人工智能芯片应运而生并不断迭代升级。对2024年人工智能芯片技术领域的主要发展动向进行了综合评述。首先介绍推动人工智能芯片技术发展的主要举措,随后探讨了人工智能芯片技术的发展现状,最后展望了人工智能芯片技术的未来发展的新趋势。综述表明,构建技术及产业联盟、持续加大投资力度,成为当前人工智能芯片技术与产业高质量发展的重要推动力;以光子芯片为代表的新型人工智能芯片、新型材料(例如仿生仿脑材料)在人工智能芯片中的应用、人工智能技术赋能人工智能芯片设计与制备,是当前人工智能芯片技术的发展重点;从应用场景与需求出发,人工智能芯片技术已呈现出向高容量密度、低功耗、高定制集成等方向发展的趋势。
关键词人工智能芯片;人工智能;光子人工智能芯片;仿生材料;神经拟态计算;芯粒
人工智能芯片,是一种专门用于处理AI应用中的大量计算任务的硬件,又被称为人工智能加速器或计算卡。当前,人工智能技术的快速地发展对AI芯片提出了新的需求:以深度学习算法为核心的人工智能技术的训练和推理需要处理海量数据,然而传统计算架构无法有效支撑当前AI应用对大规模计算的需求[1-2],因此,旨在更好地适应数据流式处理模式从而优化计算效率、全新架构的人工智能芯片应运而生并不断迭代升级。随着人工智能芯片技术的发展,新的设计方法和计算架构不断涌现,也在某些特定的程度上推动了整个半导体产业的进步。
美欧等国家地区尝试通过构建技术及产业联盟、持续加大投资力度等多重手段,谋求巩固其在人工智能芯片技术领域的竞争力,从而强化其在全球AI产业的竞争力。
2.1构建人工智能芯片技术与产业同盟,成为现阶段推动该领域技术发展的主要手段之一
高度重视产业链完整与安全,通过大力推动产业同盟建设,以凸显集群效应,来提升芯片供应链的自给率。美商务部2月指出,美应持续加大对人工智能芯片等半导体制造业的投资力度,旨在重塑其在全球范围内的领导地位,并满足人工智能技术发展的需求,为此有可能需要出台《芯片法案2.0》[3],助力美建立新的人工智能芯片代工厂和半导体创业企业。为此,7月,美国务院和美洲开发银行启动了“西半球半导体倡议”,寻求在拉美地区建立人工智能芯片产业同盟[4],以提高主要伙伴国家(墨西哥、巴拿马和哥斯达黎加等)的半导体组装、测试和封装能力,以期减少对亚洲地区的依赖,并在美洲地区完成美国芯片的封装工作。该计划将促进公私合作伙伴关系的建立,并遵循经济合作与发展组织的建议,以发展这些国家的半导体产业生态系统。据透露,该计划的首批项目将在墨西哥、巴拿马和哥斯达黎加启动,后续将扩展至美洲其他国家和地区。1月,作为全球半导体制造行业主要国家地区之一的韩国拟定了至2047年在首尔南部地区打造全球最大半导体产业集群的计划[5],其目的是为了进一步巩固该国在全球芯片产业中的领先地位。目前该集群已经包含了19家生产工厂和2家研究机构;预计到2047年,该集群将新增13家生产工厂和3家研究机构,其中包括三星电子和SK海力士的622万亿韩元(折合约4714亿美元)的投资项目。为了保障这一超大规模产业集群的顺利发展,韩国政府将致力于推动供应链的自给自足,设定了到2030年实现关键材料、零部件和设备50%自给自足的目标。
为应对外部竞争压力,部分全球人工智能巨头企业正在构建技术联盟。例如,5月,美国英特尔、谷歌、微软、META等八家科技企业联合组建名为“超加速器链接(Ultra Accelerator Link,UALink)”的推广联盟[6],该联盟的宗旨是引领数据中心内人工智能芯片连接组件的技术发展,同时也为了应对美国英伟达公司在全球人工智能芯片领域一家独大的局面。该联盟致力于制定开放性行业标准,以促进人工智能加速器之间的顺畅通信,为数据中心的纵向扩展人工智能系统链接推进高速和低延迟通信,从而提高处理人工智能任务海量数据的能力。其中,UALink 1.0规范预计将向联盟成员企业提供。最终,该联盟期望使系统人工智能芯片设备制造商、相关行业从业人员和系统集成商能够为其人工智能连接的数据中心创建一个更容易集成、更大灵活性和可扩展性的途径。
2.2持续加大对人工智能芯片技术的投资力度,以便应对行业竞争及谋求技术领先地位
通过在人工智能芯片领域的持续性投资,不仅能够满足对人工智能芯片持续增长的需求,而且额外的资金支持将使得更多的企业能够继续开展人工智能算法和服务的研发。截至7月,美已承诺向半导体及电子产业投资3950亿美元[7]。自《芯片与科学法案(The CHIPS Act)》签署实施以来,美国商务部已批准多笔资金,以促进半导体技术的研发与生产。这些公共投资也激发了私营企业的投资热情,共同推动了半导体及电子行业的发展。例如,1月起,全球生成式人工智能领军科研企业、美国OpenAI公司持续与全球范围内的投资者进行接洽,实施一项旨在推动人工智能芯片全球制造的大规模投资计划,以期筹集高达数十亿美元的资金[8],与全球顶尖的芯片制造商(潜在的合作伙伴包括英特尔、台积电和三星电子等企业)携手合作,建立一个半导体芯片制造工厂网络。目前OpenAI公司已与数家大型潜在投资者展开对话,合作伙伴包括总部位于阿布扎比的G42公司以及软银集团等。
美、欧、韩等全球人工智能芯片领军国家和地区,期待通过投资方式来谋求或巩固行业领导地位。7月,美DARPA宣布与得克萨斯大学奥斯汀分校建立一项为期5年、资金投入达14亿美元的合作伙伴关系,旨在共同创建美国首个先进微电子制造中心[9],以促进美国本土微电子制造业的发展,并实现未来芯片的快速原型设计。作为“下一代微电子制造计划”的一部分,该研究中心将聚焦于三维异构集成微系统的研究,旨在为美国军事部门研发新一代的芯粒技术等,其首要任务是建立一个位于美国本土、开放的3DHI微系统原型设计和试验线制造中心。该项目计划分为两个阶段实施,其中第一阶段将着重于构建基础能力和基础设施,第二阶段则将正式启动制造工作。5月,依托《欧洲芯片法案》,欧盟委员会宣布已经以直接财政拨款的形式向意法半导体公司投资20亿欧元[10],支持该公司在意大利建立一家碳化硅芯片制造厂。此举旨在提升欧洲在半导体技术领域的供应链安全、产业韧性和数字主权。据悉,该芯片制造厂的总投资预计将达到约50亿欧元,主要用于开发基于200毫米直径晶圆的高性能SiC芯片的生产技术,预计到2032年将达到满负荷运行状态。5月,为了保持在芯片设计和制造等领域的领先地位,韩国宣布了一项总额达26万亿韩元(折合约190亿美元)的人工智能芯片及半导体产业支持计划[11]。该计划涵盖了17万亿韩元(折合约119亿美元)的财政补贴和税收减免,针对特定投资提供支持,并计划将原定于2024年底到期的半导体产业税收优惠政策予以延期。一直以来,韩国的半导体产业投资主要由三星、SK等私营企业主导,但是在人工智能芯片设计和代工芯片制造等领域已经落后于一些竞争对手,因此韩国政府正在采取更为积极的干预措施来扭转被动局面。
近来,以光子人工智能芯片为代表的新型芯片作为最新研发热点,在高速通信与并行计算领域取得技术突破;新型材料(例如仿生仿脑材料)的开发,显著提升了人工智能芯片的性能与稳定性;同时,人工智能技术促进了芯片设计的高效发展。
3.1适用于高速通信和并行计算等场景的光子芯片成为研发热点并得到政策大力支持,技术突破的同时应用场景不断明晰
光子人工智能芯片是一种利用光波在芯片中的传播来进行计算的新型芯片,将传统的电子计算载体转换为光学计算,通过光电混合架构来实现高速和高并行的计算能力,尤其适用于需要大量计算和高能效的人工智能计算任务[12]。目前,光子芯片已经频繁出现在世界主要国家的人工智能发展规划和投资计划中。7月,美商务部下属经济发展局宣布将向全国12个科技创新中心提供总额达5.04亿美元的资助,旨在扩大关键技术的生产规模,并创造新的就业机会,其中智能光子传感器及芯片,将作为重点的科技创新资助方向[13]。同期,加拿大政府启动名为“互联网边缘网络集成组件制造(Fabrication of Integrated Components for the Internet’s Edge (FABrIC))”的计划,用以资助人工智能芯片原型产品的生产,并为相关利益方提供更为经济的工具、软件及培训支持,其中为光子人工智能芯片等现金硬件开发领域提供1000万加元(折合约735万美元)的资金支持[14]。
2024年,光子人工智能芯片技术研发出现多个首创,其在大规模通信与并行计算领域的优势呈现扩大化趋势(如图1所示)。4月,西班牙瓦伦西亚理工大学联合研究团队成功研制出全球首款通用型、可编程且多功能的光子人工智能芯片。该芯片实现了通信网络中无线与光子部分的按需编程与互连,有效突破了通信容量与带宽限制的问题。此研究成果预期将为数据中心及网络中的数据流管理提供高效的解决方案,从而在电信行业、数据中心以及人工智能计算系统等多个领域展现出广阔的应用前景,相关成果发表于《自然(Nature)》期刊[15]。9月,美国康奈尔大学成功研制了世界上首个“光子-电子”双面人工智能芯片(如图2所示),该芯片实现了电子与光子功能的集成并结合了二者的优点。该研究利用了氮化镓(GaN)材料的独特性质——该材料沿晶轴方向展现出显著的电子迁移率差异,导致其两个表面的物理与化学特性存在显著差异,即镓(阳离子)一侧适合于制备发光二极管和激光器等光子器件,而氮(阴离子)一侧则适合于集成晶体管等电子器件,在此基础上,在氮化镓芯片上实现了高电子迁移率晶体管与发光二极管的结合。这一创新可以缩小功能器件的尺寸,使其更节能,降造成本,该成果标志着在电子与光子集成领域的一次重要突破,有望促进光子人工智能芯片及设备的进一步发展,相关成果发表于《自然(Nature)》期刊[16]。
3.2以仿生材料为代表的新材料研发与应用,提升人工智能芯片稳定性和效率,成为重要发展方向
新型材料的开发是技术进步的重要方向,为人工智能芯片设计提供了新的可能性。研究人员持续探索在保障甚至提升人工智能芯片小型化、密集化水平前提下保证运行稳定性、耐用性、可靠性的新材料制备。7月,美国麻省理工学院成功研制了一款创新的超薄铁电晶体管,并基于此材料制成了新型晶体管。该晶体管能够在正负电荷之间实现高速切换,以模拟计算机编码中的“0”和“1”状态,即使在经历了1000亿次的开闭操作后,仍能保持稳定运行,且其厚度仅为十亿分之一米(世界上同类材料中最薄之一),从而允许更密集的计算内存存储,由此可以衍生更节能的晶体管(开关所需的电压随材料厚度而变化)。该晶体管因其卓越的性能表现,预计将在用于人工智能芯片制备的逻辑运算设备和非易失性存储设备中得到广泛应用,相关成果发表于《科学(Science)》期刊[17]。
模拟大脑连接结构与功能机理的仿生材料,为提升人工智能芯片通信效率、降低人工智能芯片使用能耗提供可能性,成为2024年研究热点。具有多模式信号处理的脑启发人工智能芯片被普遍视为下一代半导体平台[18],但是当前传统冯·诺伊曼架构限制了数据处理和能耗效率,2月,韩国庆尚大学联合团队首次实现基于通道表面分子动力学的可调电子诱导人工突触装置可塑性的分子重构(如图3所示),从而实现高逼真度模仿生物突触的神经递质释放等生物突触性能和复杂功能[19]。此外,由于该器件的分子可重构性,兴奋性和抑制性突触模式的突触重量显著增强,为在人工智能芯片(乃至多模态信息接口)上复制和设计人脑的基本特征奠定基础。4月,受人脑高效率信号传递机制启发,荷兰乌得勒支大学联合研究团队成功构建了一种新型的人造突触,此举为开发类脑人工智能芯片及计算系统提供了新的可能性,相关成果发表于《美国国家科学院院刊(Proceedings of the National Academy of Sciences)》期刊[20]。该人造突触的尺寸规格为150微米×200微米,被命名为离子电子忆阻器,包含一个充满水和盐离子的锥形微通道,能够依据所接收电脉冲的强度来调节通道的电导率,从而模拟神经元间连接的强化或弱化过程,其工作机制与生物突触相似。该成果通过采用与人脑相似的介质来模仿人脑的通信模式,为研制能够更逼真地再现人脑卓越功能的人工智能芯片及相关计算系统奠定了理论基础。在仿生材料与元器件高密度集成方面,1月,韩国科学技术研究院成功研发一种先进的仿生元件集成技术,使得人工神经元与人工突触的连接如同搭建积木般便捷[21],从而为硬件层面实现人工神经网络奠定了基础(如图4所示)。该研究采用二维材料hBN,该材料有助于实现高集成度和超低功耗,成功制造出垂直堆叠的忆阻器器件;通过将这些器件进行集成和连接,在硬件中构建了人工神经网络的基本单元模块——“神经元—突触—神经元”结构,实现了神经元间尖峰信号信息的调制,并能根据人工突触装置的突触权重进行调节。该成果为大规模人工神经网络硬件的开发提供了关键支持,同时显著降低能源消耗。
3.3人工智能技术与系统赋能人工智能芯片设计及研发,二者呈现“互哺互补”良性互动状态
如何使用人工智能技术为人工智能芯片制备效率提速,近年来逐渐成为各界关注焦点[22]。5月,依据《芯片与科学法案》提供的总计2.85亿美元的资助,美国家标准与技术研究院宣布计划建立一个全新的芯片制造研究所,将重点采纳数字孪生技术,以促进以人工智能芯片为核心的下一代半导体在制造、封装、组装及测试流程中的开发与验证工作[23]。在该计划中,数字孪生技术将作为一种模拟物理实体结构、环境及行为的虚拟模型,在云端运行,以促进工程师与研究人员在设计和流程开发方面的协作。最终,美国家标准与技术研究院期望通过运用人工智能、数字孪生等前沿技术,加速新型芯片的开发与制造进程并降低成本,进而提升美国在芯片制造领域的竞争力。
人工智能技术从“算法-系统-硬件”的全维度介入芯片设计过程,极大提升人工智能芯片的开发速度并降低开发成本。从算法模型角度,9月,美国谷歌DeepMind公司正式发布用于人工智能芯片设计的AlphaChip模型,达到几小时内完成精度比肩人类专家的芯片布局设计图的效果。该模型基于深度强化学习和智能体,从之前的芯片布局中进行学习,生成新的设计方案(如图5所示);此外,利用一种新型的基于边缘的图神经网络,支持学习互联芯片组件之间的关系,并应用在芯片之间,因此能对设计的每个布局进行改进。该成果已经应用在谷歌目前最先进TPU芯片(包括Trillium芯片)的设计过程中,相关成果发表于《自然(Nature)》期刊[24-25]。从系统平台角度,2月,英国Arm公司发布创新性的人工智能芯片设计工具[26],该工具能够将数据中心处理器的开发周期缩短至不到一年,从而有望帮助人工智能芯片设计公司加快步伐以应对市场竞争的日益加剧。Arm公司的CPU架构因其与英伟达显卡的高效协同作业能力,已成为数据中心的人工智能处理器构建的首选架构,并得到广泛应用。该设计工具将计算核心与Arm的其他产品相整合,形成更为完整的芯片设计方案,用户利用该工具能够在不到一年的时间里完成人工智能芯片设计的全过程。微软公司已采用该工具设计了Cobalt芯片。硬件方面,4月,美国楷登电子公司发布人工智能芯片设计专用超级计算机Palladium Z3和Protium X3[27](如图6所示),旨在提升人工智能芯片(包括大模型专用芯片)与软件的开发效率。这两款超级计算机具备构建人工智能虚拟芯片版本的能力,使得在物理芯片尚未生产完成之前,即可着手进行相应软件的开发,从而显著缩短芯片及其配套软件的迭代周期,当前版本比上一版本产品速度提升1.5倍。其中,Palladium Z3采用全新定制Cadence仿真处理器,提供最快、最可预测的编译和全面的预芯片硬件调试;Protium X3能够为十亿门设计的预硅软件验证提供最快的启动时间。目前英伟达正在对这一新型芯片设计超级计算机进行测试,其仿真能力较上一代系统提高了整整一倍。
人工智能芯片的发展正在经历从传统的CPU架构向更适用于深度学习算法的特殊定制芯片转变,这些芯片需要具备高算力、高容量和快速的数据访问及传输速率。高容量密度人工智能芯片成为支撑高性能计算的关键,这种需求不仅在数据中心等云端部署中显著,也逐渐向边缘端扩散,形成分布式高算力网络。
因此,以计算密度、内存带宽为代表的容量密度指标,逐渐成为人工智能技术执行推理任务的瓶颈。6月,美国美光科技公司推出业界容量密度最高的新一代GDDR7人工智能芯片[28],实现了速率高达32 Gb/s的高性能内存,同时系统带宽超过每秒1.5 TB(相较于前一代提升了60%),配备了4个独立通道以优化工作负载,实现了更快的响应和更短的处理时间,同时提升了50%的能效;此外,芯片增强了设备的可靠性和数据完整性,使其适用于包括人工智能、游戏和高性能计算在内的多种应用场景。为了实现高密度和高容量,未来的人工智能芯片技术将依赖于新材料和更先进的制造工艺,例如使用粗粒度可重构架构等,可以在不增加功耗的前提下提高芯片的容量密度;此外,随着技术发展,集成封装技术也在不断进步,这将有助于提高芯片的密度和容量,例如采用基于先进集成的芯粒技术,可以在维持甚至提高性能的同时,减小芯片的体积和功耗。
在智能设备和物联网应用中,低功耗人工智能的需求日益增长。这要求相关技术能在极低的功耗下实现实时在线的人工智能服务,这不仅是对人工智能算法、更是对人工智能芯片技术提出了挑战。支持模拟人脑的处理和存储数据机制的神经拟态计算技术及存算一体框架,为低功耗人工智能芯片研发提供了思路。近来,各界持续对神经拟态计算架构展开探索,例如4月,美国英特尔公司发布全球规模最大的神经形态计算机Hala Point[29],集成了高达115.2亿个模拟神经元,分布于1152颗Loihi 2芯片之上,其每秒可执行高达380万亿次突触操作,显著提升了人工智能模型的运算效率和处理能力,并且在执行优化任务时所消耗的能源仅相当于传统计算机的百分之一。
为了进一步降低人工智能芯片的功耗,一方面继续探索脉冲神经网络与深度神经网络相结合的计算范式,充分利用前者更贴近生物神经网络的特性,通过将时域信息引入计算过程,以实现更高效的拟人态推理;另一方面,探索仿生理论对于面向神经形态计算的智能芯片与器件技术的赋能,帮助神经网络加速器、基于传统CMOS的神经形态智能芯片、新型神经形态器件技术等在提高计算效率、降低能耗以及解决器件规模化和可靠性问题等方面实现升级换代。
随着人工智能芯片应用场景的丰富,对于定制化芯片的需求激增,如何支持各类用户灵活地按需组织和弹性调整人工智能芯片的组合与集成方式进而更好地完成差异化、个性化的应用任务,是未来亟待解决的关键技术难题。为此,人工智能芯片领军企业之一美国英特尔公司已经开始着手进行研发重心的战略转移,并预测定制化芯片在2025年后逐渐成为行业趋势。1月,美国英特尔公司宣布拟将研发重心转向芯粒(又称为“小芯片”)等前沿技术领域[30],并已经开始致力于融合芯粒技术与人工智能等多种新兴技术,同时着手制定详尽的技术发展路线图。
从开发角度,芯粒技术允许将复杂的人工智能芯片设计分解为多个更小、更简单的功能模块,这种模块化设计可以提高设计效率,缩短研发周期,并降低生产成本;从使用角度,芯粒技术有望消弭服务器(云端)与客户端(边缘计算)产品之间的界限,通过按需组装“通用”人工智能芯片形成“专用”人工智能芯片组合,最终实现对特定行业快速定制化芯片的生产,用户可以快速组装满足特定功能需求的芯片,这对于边缘计算和特定行业应用尤为重要。此外,通过芯粒技术,可以将不同工艺节点、不同材料的芯片模块集成在一起,实现异构计算。这对于人工智能芯片来说尤其重要,因为它可以结合多种计算资源,以优化性能和功耗。
人工智能芯片技术不仅是推动AI产业发展的核心引擎,更是引领未来科技革命的重要力量。它不仅能够解决传统计算架构无法有效支撑人工智能大规模计算需求的难题,还能为人工智能应用提供更强大的算力、更低的功耗和更灵活的定制化能力。这将极大地推动人工智能技术在各个领域的应用落地,从而为社会带来巨大的经济效益和社会效益;同时,人工智能芯片技术也将推动半导体产业的进步,带动相关产业链的发展,并为解决全球性挑战提供新的解决方案。因此,人工智能芯片技术的研究与发展,不仅具有重大的经济意义,更具有深远的战略意义,它将为人类社会的发展进步注入新的活力,开启智能时代的新篇章。
《无人系统技术》是由中国航天科工集团有限公司主管、北京海鹰科技情报研究所主办,中国无人系统产业联盟(筹)、西北工业大学无人系统发展战略研究中心、西北工业大学无人系统技术研究院联合协办的学术期刊。办刊宗旨为刊载无人系统领域新进展、新成果、新技术,促进学术交流,推动成果转化,提高我国在该领域的科研装备水平。返回搜狐,查看更加多