TPU直通决赛圈!十年磨一芯 谷歌做对了什么?

理财派对 2025-11-30 阅读:67814

  随着Gemini 3的横空出世,谷歌TPU从幕后走到台前。英伟达GPU的霸主地位已然有被撼动迹象。

  谷歌云内部高管透露,扩大TPU的市场采用率,有望帮助公司抢占英伟达年收入份额的10%。紧接着,市场便传出“谷歌加紧向客户推销TPU”“Meta拟斥资数十亿美元购买TPU”等一系列消息。大摩分析师大胆预测,2027年谷歌TPU外销量将达到100万颗。

  另一边,投资者纷纷用脚投票,表达了对英伟达GPU市场遭遇侵蚀的担忧。英伟达官方发布紧急声明,强调自家产品比ASIC拥有更高的性能、更强的通用性以及更好的可替代性。

  从闭关修炼的隐世高手,到如今直通AI芯片的决赛圈,谷歌TPU的起源还要从12年前的那场“算力焦虑”说起。

TPU直通决赛圈!十年磨一芯 谷歌做对了什么?

  ▌深度学习的最优解

  2013年,深度学习在谷歌内部的应用开始不断扩散,后台模型的复杂度和算力消耗规模逐渐呈指数级增长。谷歌首席科学家Jeff Dean通过计算发现,若1亿安卓用户每天使用3分钟语音转文字服务,则消耗的算力竟高达谷歌所有数据中心总算力的两倍不止。

  堆砌GPU以获取算力固然是符合直觉的选项,但由于“冯·诺依曼瓶颈”的存在,导致诸如CPU和GPU等计算单元在处理深度学习中大规模矩阵乘法等特定任务时效率低下。相比之下,自研ASIC加速器可为机器学习任务定制架构,能将深度神经网络推理的总体能效降至原来的十分之一,长期来看成本更为可观

  于是在2013年底,谷歌正式启动了初代TPU项目。据报道,当时谷歌内部有三个团队投身于ASIC的研发工作,包括 Google Brain、DeepMind以及专注数据中心定制硬件开发的部门。后者的TPU最终获选,其关键成员具备多年的芯片架构设计经验。如Jonathan Ross曾参与AMD的Zen架构设计,并于后来创立了AI芯片设计公司Groq。

  谷歌团队进展迅速,距立项仅过去15个月,便完成了初代TPU的设计、验证、制造,乃至在数据中心的部署。项目牵头人Norm Jouppi如此描述当时情景:“我们的芯片设计速度非常快,在没有修正错误或更改掩膜的情况下便已开始出货芯片。”

  2016年,TPU迎来了它的首个“破圈时刻”:人工智能围棋程序AlphaGo击败了世界围棋冠军李世石,引发了人们对AI的广泛关注。当时AlphaGo背后正是初代TPU在提供算力支持。

  研发上,重大的转折发生在2017年。这一年,谷歌团队在《Attention Is All You Need》中介绍了Transformer——一种基于注意力机制的全新深度学习架构。其计算特性与TPU设计高度适配,最终推动 TPU的战略地位从单一AI加速芯片升级为谷歌的AI基础设施底座。值此背景下,TPU v2应运而生。

  同样在这一年,谷歌宣布免费开放 1000 台 Cloud TPU 供开发者和研究人员使用,进一步巩固了TPU 作为AI 基础设施底座的地位。往后的日子里,谷歌引入了大规模液冷技术,将4096颗芯片组成超节点,并利用自研的环形拓扑网络实现近乎无损的跨芯片通信。在各路“外挂”的加持下,TPU朝着更强的性能一路狂飙。

  而在技术之外,谷歌也毫不悭吝地将TPU引进广告系统、搜索核心排序等赚钱产品线。在2024年的应用开发与基础设施峰会上,谷歌公开表示,TPU V6及后续版本的目标是成为“推理时代最省钱的商业引擎”

  往后的故事逐渐为人所熟知,随着TPU v7被投入人工智能训练,当今公认的最强多模态模型Gemini 3横空出世。谷歌也摇身一变,从算力芯片领域的追随者一跃成为市场眼中的AI新王。人们不禁好奇,十年磨一芯,谷歌究竟做对了什么?

  ▌难以复制的生态护城河

  回顾谷歌的造芯故事,里面没有通往AGI的宏大愿景,也没有遵循Scaling Law的绝对指引,而是始终紧扣一项更符合商业逻辑,也更显务实的指标——成本。

  如果深究,则TPU的历史可以一直追溯到2006年,那时谷歌便开始考虑为神经网络构建ASIC的可能性。只不过由于当时互联网正处于爆发前夜,谷歌数据中心的GPU算力仍有大量冗余,相关需求并不迫切,因此并未透支额外成本来实际推进这一计划。

  这种“量体裁衣”的理念甚至体现在TPU的设计架构本身。与GPU不同,TPU采用极简的“脉动阵列”架构,这虽然付出了放弃硬件通用性的代价,但也意味着能够剥离掉一切无关硬件,从而保证在最小单位追求深度学习的最大效率。

  现如今,这种设计架构显然为谷歌带来了远超“节省成本”的回报,即与其他顶尖AI厂商掰手腕的资本。

  更重要的意义在于,与其他厂商严重依赖外部算力和云设施不同,谷歌以TPU为底座的垂直整合路线,构建出了“芯片-云-模型-应用”的全栈AI能力链条。正如券商分析师们所言,这令其形成了难以复制的生态护城河,也赢得了定义未来AI基础设施的入场券。

(文章来源:财联社)

热门文章
  • 2025年1月北京房市数据大揭秘

    2025年1月北京房市数据大揭秘
    2025年1月,北京的新房和二手房网签量表现不同,新房签约103套,二手房签约101套。回顾过去几个月,北京的房屋交易数量有所变化,12月新房签约5322套,二手房21556套。而在11月和10月,新房和二手房的签约数量也有所不同。本文还提到北京的房价走势及各区域的房价情况,让购房者对市场变化有更清晰的认识。 2025年1月的北京房地产市场数据,显示出新房和二手房市场的不同表现,这种动态值得我们关注。作为中国首都,北京的房地产市场一直受到全国的关注。过去几个月的签约...
  • 特斯拉 Optimus 人形机器人试生产线亮相,马斯克称年底数千台将入驻工厂

    特斯拉 Optimus 人形机器人试生产线亮相,马斯克称年底数千台将入驻工厂
    在特斯拉 2025 年第一季度更新报告中,公司首次向外界展示了 Optimus 人形机器人试生产线。特斯拉表示,Optimus 的生产时间表保持不变,公司正朝着尽快生产出能够完成有用工作的首批人形机器人的目标迈进。 据IT之家了解,特斯拉的 Optimus 试生产线位于弗里蒙特工厂,这里是特斯拉众多项目的起点。公司希望在年底前将 Optimus 机器人的部署范围扩大到旗下更多工厂。 在特斯拉第一季度财报电话会议上,埃隆 马斯克分享了 Optimus 项目的最新进展:“...
  • 科创综指ETF南方(认购代码:589663)2月17日起正式开售

    科创综指ETF南方(认购代码:589663)2月17日起正式开售
      中国网财经2月7日讯 随着首批科创综指ETF正式获批,市场迎来科创板投资新工具。日前,南方基金发布公告,南方上证科创板综合ETF(简称:科创综指ETF南方;认购代码:589663)将于2月17日正式开售,有望为投资者布局"硬科技"赛道提供高效配置工具。   业内人士指出,随着科创板上市公司数量的提升,上证科创板综合指数的推出为科创板市场提供更丰富、更全面的投资工具,与现有的科创50、科创100、科创200 等规模指数形成互补,为投资者提供了一种便捷的投资科创板的方式,有...
  • 化工行业周报:丙烯酸等本周涨幅居前,赛轮ESG表现获肯定

    化工行业周报:丙烯酸等本周涨幅居前,赛轮ESG表现获肯定
    (以下内容从信达证券《化工行业周报:丙烯酸等本周涨幅居前,赛轮ESG表现获肯定》研报附件原文摘录) 本期内容提要: 基础能源(煤油气)价格回顾:截止2025/01/02,WTI原油价格为71.72美元/桶,周环比上涨1.27%;布伦特原油价格为74.64美元/桶,周环比上涨1.10%。截止2025/01/03,动力煤价格为662元/吨,周环比上涨0.61%;LNG价格为4527元/吨,周环比下跌0.64%。 基础化工板块市场表现回顾:本周(2024/12/27-2025/01...
  • 《2024年度中国慈善信托发展报告》解析(上):蓬勃发展与现存挑战

    《2024年度中国慈善信托发展报告》解析(上):蓬勃发展与现存挑战
      中国网财经3月3日讯 日前,中国信托业协会慈善信托专业委员会与中国慈善联合会慈善信托委员会联合发布《2024年度中国慈善信托发展报告》(简称《报告》)。这一连续八年发布的年度报告,不仅是对慈善信托行业发展的阶段性总结,更是洞察其未来走向的重要窗口。在过去的2024年,慈善信托领域呈现出诸多新变化,既有着令人瞩目的发展成果,也面临着一系列亟待解决的问题。   政策助力慈善信托发展态势良好   记者了解到,2024年9月新修订的《慈善法》正式实施后,为慈善信托的稳健发展筑...