您现在正在浏览:主页 > 科研督导 > 科研动态 >
 

谷歌TPU及强化学习行业动态研究:谷歌TPU以时间换吞吐量 加速云端AI帝国;ALPHAGO从LEE到零 探索强化学习新

发布时间:2018-01-13 09:19  来源:www.xjshzzy.com   浏览次数

 
谷歌TPU:以时间换吞吐量,软硬兼施,冲入云端
人工智能立夏将至的大趋势下,芯片市场蛋糕越做越大,足以让拥有不同功能和定位的芯片和平共存,百花齐放。后摩尔定律时代,我们强调AI 芯片市场不是零和博弈。我们认为在3-5 年内深度学习对GPU 的需求是当仁不让的市场主流。行业由上至下传导形成明显的价值扩张,英伟达和AMD最为受益。在深度学习上游训练端(主要用在云计算数据中心里),GPU 是当仁不让的第一选择,但以ASIC 为底芯片的包括谷歌的TPU、寒武纪的MLU 等,也如雨后春笋。而下游推理端更接近终端应用,需求更加细分,我们认为除了GPU 为主流芯片之外,包括CPU/FPGA/ASIC 等也会在这个领域发挥各自的优势特点。

但我们需要强调,包括TPU 在内的ASIC 仍然面临通用性较弱,以及开发成本高企等局限。TPU 虽然理论上支持所有深度学习开发框架,但目前只针对TensorFlow 进行了深度优化。另外ASIC 芯片开发周期长和成本非常高,在开发调试过程中复杂的设计花费有时甚至会超过亿美元,因此需要谷歌这样的计算需求部署量才能将成本分摊到大量使用中。同时ASIC 开发周期长,也可能会出现硬件开发无法匹配软件更新换代而失效的情况。

TPU 是针对自身产品的人工智能负载打造的张量处理单元TPU。第一代主要应用于在下游推理端TPU。本质上沿用了脉动阵列机架构(systolic arraycomputers),让推理阶段以时间换吞吐量。第二代TPU 除了在推理端应用,还可以进行深度学习上游训练环节。将TPU 部署在云计算中以云服务形式进行销售共享,在为数据中心加速市场带来全新的需求体验的同时,可进一步激活中小企业的云计算需求市场,另辟AWS、Azure 之外蹊径。

AlphaGo 的“终点”,强化学习的起点
我们在今年1 月的报告《2017 MIT 人工智能5 大趋势预测:寒梅傲香春寒料峭,人工智能立夏将至》中提到第一大趋势预测:正向强化学习(PositiveReinforcement)正成为深度学习(Deep Learning)后研究应用的最新热点。

强化学习(Reinforcement Learning)的目的是尝试解决对人类标注样本的依赖,并打破特定板块和领域里的学习局限,向无监督、通用型人工智能拓展。强化学习的灵感来自于动物的学习方式。动物能够学会某些特定行为所导致的正面或负面结果(a positive or negative outcome)。按照这种方法,计算机可以通过试错法(trial and error)来与训练环境互动,包括sensoryperception 和rewards,来决定这一结果的行为相关联。这使得计算机可以不通过具体指示或范例(explicit examples)去学习。

当前人工智能主流应用还是基于深度学习神经网络,从针对特定任务的标记数据中学习,训练过程需要消耗大量人类标注样本。而在很多现实场景下,特定垂直领域的数据并不足以支持系统建构,我们认为强化学习有机会成为下一个机器学习商业成功的驱动力。

谷歌重申买入:人工智能巨头新征途:云+YouTube+硬件
我们早在年初已经开始强调,AI 巨头谷歌的新征途——云+YouTube+硬件。YouTube 和云计算的巨大增长动力将是谷歌持续转型的助推器:YouTube 百般武艺冲劲十足,Q3 广告业务净营收增速回升至21%,移动端积极转型执行力坚决。长期眼光看AI 和Other Bets 创新业务厚积薄发:谷歌是人工智能的龙头标的,我们长期看好语音识别和无人驾驶的发力。公司20 日收盘价1035 美元,根据彭博一致预期2018 年EPS 40.15 美元,给予30x PE,目标价1200 美元,重申“买入”评级。

风险提示:芯片市场竞争加剧,研发速度不及预期等。

□ .何.翩.翩  .天.风.证.券.股.份.有.限.公.司