近日,云天励飞召开了主题为“智能芯生·推理异日”的媒体疏浚会,矜重通知异日将全面聚焦东说念主工智能(AI)推理芯片,并将围绕角落推测、云表大模子推理、具身智能三大中枢布局,打造国产AI推理“加快器”。
“第四次工业创新”来袭,AI推理芯片将是“钥匙”
2022年底,跟着OpenAI的生成式AI应用ChatGPT的发布,矜重开启了生成式AI的元年。ChatGPT其凭借大说话模子(LLM)的加捏,展现出不凡的AI体验,激发了巨匠的关心。随后,千般大模子时刻也初始呈现爆发式的发展,时刻迭代周期从“三到五年”裁汰至“三个月”。在此配景之下,业界也普遍预期,到2030年通用东说念主工智能(AGI)将会达成。
云天励飞董事长兼CEO陈宁以为,跟着2030年AGI的达成,这将成为“第四次工业创新”初始的一个象征性里程碑的时刻点。而AGI的达成离不开大算力AI芯片的加捏,雷同中国的东说念主工智能产业能否收拢这么一个历史机遇,关键亦然在AI大算力芯片。这亦然为什么畴昔五年来巨匠科技竞争皆聚焦在AI大算力芯片领域的原因。
畴昔多年来,AI大模子时刻的发展主若是依赖于英伟达的GPU来进行查考。可是跟着AI大模子时刻的迟缓锻真金不怕火,模子调用资本显耀虚拟,AI时刻的发展也初始由查考阶段转向以应用为导向的推理阶段,特殊是跟着端侧及角落算力的提高,面向推理当用的AI智能体(Agent)初始在端侧及角落加快落地,赋能千行百业。
陈宁指出:“咱们正在由AI查考期间进入到AI推理期间(以Deepseek开源等为象征)。如果说AI查考是‘发电’,那么AI推理即是‘用电’。AI推理期间意味着AI应用普惠化、无处不在(Agent资本极大虚拟),东说念主东说念主将拥抱AI。”
在陈宁看来,跟着“AI推理期间”的到来,中国东说念主工智能产业也将迎来两大机遇:异日五年,以AI大模子、算法和推理芯片为中枢的AI时刻从头界说扫数电子居品;异日五到十年,巨匠将会构建一张无处不在的低资本、高效果的AI推理算力网罗。而要收拢这两大机遇,那么就离不开AI推理芯片的复古。
11年五代NPU三大SoC系列,全面聚焦AI推理需求
建造于2014 年的云天励飞,一初始就聚焦于通过自研的 NPU(神经网罗处理器) 来虚拟 AI 算法推测资本,而况那时还用 NPU 课题讲述了政府的东说念主才引进技俩,而况取得了第别称,得到了研发资金的支捏。不错说,芯片晌刻,恰是云天励飞初期取得投资的关键。
云天励飞的NPU内核是基于自研教导集架构,好像潜入匹配特定应用场景,并在教导层面达成更高效的优化。这种深度定制使NPU内核在性能、功耗与面积之间达成更优量度,从而以合理资本鞭策AI芯片庸碌落地,信得过阐明出场景中的最优效率。
经由11年发展,云天励飞陆续推出了五代NPU(最新的是Nova 500)。从Nova 100只支捏简便的CNN算法,迭代到2022年研发的Nova400就前瞻性布局了高效的Transformer推测范式。当今正在研发的Nova500,蓄意是不错高效支捏万亿级参数的大模子以及面向具身智能的端到端的通晓大模子。
与此同期,云天励飞还针对角落推理场景(深界系列芯片)、大模子推理场景(深穹系列芯片)、具身智能场景(深擎系列芯片)推出了会通其NPU内核的三大SoC系列芯片平台。
“咱们花了10年时刻千里淀了一个丰富的居品矩阵,从IP、软件栈、天书多模态大模子,再到以算法的基础的AI推理芯片平台,以及基于这些芯片的一系列开拓。还有一系列面向醒目城市、醒目买卖、醒目交通等应用的措置决策。”陈宁还特殊例如说念,旧年头收购的智能穿着开拓IDH公司岍丞时刻,在云天励飞的NPU IP时刻加捏下,旧年无线蓝牙耳机的销量冲突了3000万部,占中国的无线蓝牙耳机市集的35%份额。
收货于在AI推理芯片及酌量居品矩阵上的捏续参预,云天励飞的事迹也达成了快速增长。财报泄露,云天励飞2024年营业收入超9亿元,同比增长81.3%。2025年第一季度营收2.64亿元,同比增长168.23%。“基于AI推理算力需求的增长,确信下半年会连接保捏高速增长的态势。”陈宁说说念。
草创“算力积木”架构,达成大算力AI推理芯片国产化
需要指出的是,在2020年,云天励飞被好意思国列入了实体清单,这也迫使云天励飞初始全面转向了国产化供应链,成为了国内最早探索国产AI芯片自主可控的企业之一。
云天励飞CTO李爱军告诉芯智讯:“2020年之时,国产的先进制程工艺并不锻真金不怕火,绝大大皆的芯片瞎想公司首选的一定不是国产工艺。可是咱们那时就作念了一个策略性决定,全面切归国产工艺,跟国产工艺沿途发展和迭代。为此,云天励飞还草创了‘算力积木’,来措置单个大算力AI芯片的良率和资本问题。”
所谓“算力积木”架构,简便来说,即是在现存国产先进制程工艺的前提下,将正本基于海外更先进制程就能达成一颗单芯片的大算力AI芯片,拆分红多个小算力芯粒,然后期骗现存的国产先进制程工艺来进行分娩,以措置单个大算力AI芯片的良率和资本问题。之后再笔据具体应用的算力需求,通过“搭积木”的款式,将小算力芯粒通过D2D(Die to Die)“Chiplet”的款式组合成一个大的AI芯片,来达成更大的算力。如果需要更高的AI算力,则还不错通过C2C(Chip to Chip) Mesh Torus 互连时刻,将多个由小算力芯粒组合成的大算力AI芯片进一步互联成一个推测集群。
李爱军阐扬说念:“咱们遴荐‘算力积木’的架构来藏匿那时国产工艺圮绝、密度的圮绝,通过D2D Chiplet时刻达成了单个封装内集成8个‘积木’,达成128T的大算力。另外通过C2C Mesh时刻,不错造成一个更大界限的算力池,足以振奋千亿级参数的MOE架构大模子的高效的推理。”
为便于“算力积木”的小算力芯粒能圣洁达成模块化扩张与任务并行,云天励飞还自研软件栈和用具链,在算力治疗、资本规矩和封装生动性方面达成冲突。使得该架构不仅支捏一次瞎想、多种封装,也显耀提高了芯片的适配效果与居品迭代速率。
云天励飞2023年矜重发布的DeepEdge10系列芯片平台,即是基于“算力积木”架构打造的,算力范围粉饰 8T 至 256T,可达成7B、14B、130B、671B 等不同参数目大模子的高效推理,赋能千般智算推理硬件居品。当今,DeepEdge10系列芯片平台已见效适配DeepSeek R1系列模子、国产鸿蒙操作系统以及QwQ-32B模子,可为客户提供宇宙产的软硬一体化居品和措置决策。
“当今咱们的DeepEdge10和DeepEdge10Max是市面上性能和性价比最高的、好像承载3B、7B、14B多模态大模子的单芯片SoC。”李爱军相称有信心性说说念。
另据李爱军先容,当今云天励飞的DeepEdge10芯片平台也曾通过了自主可控国产化C级认证,板级决策通过100%国产化率考证。
小结:
正如前文所述,跟着AI的发展初始由“AI查考期间”转向“AI推理”期间,AI推理芯片正在成为鞭策 AI 应用界限化部署的中枢能源。
天然在“AI查考”期间,英伟达凭借CUDA生态构筑了极高的生态壁垒,访佛好意思西方对中国半导体产业的圮绝,使得国产替代繁难重重。可是,AI推理场景愈加的碎屑化(端侧/角落/云),不仅需要采集应用场景进行定制性优化,更需要有弥漫的性价比,而况这一领域尚未造成一个弥漫坚忍的生态壁垒,这也给国产厂商带来了各异化竞争的机遇。
在此配景下,云天励飞从一初始就遴荐绕开参预广大且壁垒深厚的传统的AI查考战场,逼近有限力量捏续聚焦异日更广博的AI推理市集进行创新可谓是理智之举。
凭借多年来在NPU领域的时刻积聚和“算力积木”架构创新,云天励飞见效破解了国产先进制程薄弱所带来的关于大算力AI推理芯片的瓶颈,号称国产替代的最优工程旅途。与此同期,云天励飞永久聚焦角落推测、云表大模子推理加快以及具身智能等领域的捏续深耕,也见效构建了一个涵盖‘高性能、低资本、强适配’三大上风的国产 AI 推理芯片与居品体系。
“咱们奋勉于于成为中国 AI 推理芯片的领军企业,打造面向 AI 大模子期间的关键‘加快器’,通过高性价比国产算力,鞭策东说念主工智能在千般场景中的界限落地与快速发展。”陈宁回顾说说念。
剪辑:芯智讯-浪客剑云开体育