就在未来短短一个月之内,我们即将迎来2018年业内最重磅的两大AI手机芯片发布——华为麒麟980、苹果A12。
近一年来,商业化落地已成为AI发展的一大热门主题,而智能手机领域无疑是最贴近人们生活且单一出货量最大的AI落地市场之一。
自去年华为苹果先后发布AI芯片,移动AI芯片的战火已经点燃。如今,全球前几大智能手机都已具备自产手机芯片的能力,纷纷基于AI芯片构建更全面的AI应用生态,高通作为老牌造芯工厂在手机AI芯片也表现强劲。
据华为消费者业务CEO余承东透露,华为将在8月底召开的德国IFA消费者展上发布新一代旗舰芯片麒麟980,会“遥遥领先”对手,他表示先把牛皮吹出去,再看能不能做到(华为余承东放话:手机今年出货2亿 明年冲世界第一)。
随着下个月苹果A12和今年年底到明年年初高通骁龙855的问世,下一代AI旗舰版芯片的战火将再度重燃,巅峰之战即将打响,而新的王者很有可能将在华为的麒麟980、苹果的A12和高通的骁龙855之间诞生!
去年秋天,华为推出的麒麟970拔得了手机AI芯片落地的头筹,搭载这款AI芯片的华为Mate 10和Mate 10 Pro开始进入人们的口袋。
麒麟970之所以敢称之为“AI芯片”,正是基于其全新HiAI人工智能移动计算架构中集成的专用AI处理单元——NPU(Neural-Network Processing Unit,嵌入式神经网络处理器)。
这款NPU的计算速度比CPU快25倍,能将能耗效率提高50倍,中科院计算所孵化出的AI芯片届独角兽——寒武纪科技(Cambricon)正是该NPU的技术合作方。
据传,即将推出的麒麟980将继续沿用寒武纪IP核,新一代NPU很可能就是寒武纪在今年5月推出的第三代终端IP产品Cambricon 1M。
这款NPU使用台积电7nm工艺生产,提供2Tops、4Tops、8Tops三种规模的处理器核,并支持多核互联,其8位运算效能比达5 Tops/W(每瓦5万亿次运算)
性能比前任麒麟970采用的寒武纪1A高10倍,为视觉、自然语言处理及各类经典学习任务提供更加灵活高效的计算平台。
此外,华为配合NPU推出面向开发者的HiAI移动计算平台,向开发者提供其AI计算库、API等开发所需的全套工具,也支持开发者通过TensorFlow和Caffe这些第三方框架接入。
去年,在麒麟970发布两周后,苹果公布自研AI芯片A11。A11芯片上也搭载了一个专用于神经网络计算的硬件模块——“神经网络引擎(Neural engine)”,该模块采用双核设计,能以每秒最高6000亿次速度处理机器学习任务,为FaceID的人脸识别、AR物体侦测、Animoji脸部追踪、Siri语音助手等功能提供驱动。
而今年苹果的A12芯片暂时未被曝出大的升级处理,除了可能会继续沿用去年A11使用的神经网络引擎。基于AI芯片,苹果已经初步构建起围绕AI的应用生态,包括FaceID、AR增强现实技术、Siri语音助手等应用以及Core ML、Create ML等面向开发者的机器学习工具。
作为下一代iPhone的“心脏”,A12的服务范围将有望扩展到更多的苹果生态之中,为用户开辟更广阔的移动端AI应用和开发的世界。
全球第二大手机厂商苹果和第三大手机厂商华为都在去年陆续推出搭载专用AI处理模块的移动AI芯片,作为安卓阵营手机芯片第一大提供商,高通自然也不会无动于衷。早在去年7月,高通就开放了骁龙神经处理引擎(NPE,Neural Processing Engine)的软件开发包SDK,开发者可以用它在骁龙600和800系列上优化AI应用。
今年2月,高通再度重磅出击,推出包含软硬件两部分的AI引擎(AI Engine),在骁龙核心架构上搭载了神经处理引擎(Neural Processing Engine,NPE)、Android NN API、Hexagon神经网络库等软件,是AI在智能手机等终端上的应用更快速、高效。
在和高通几位高管的交流中,智东西被告知,尽管出于保密需要,高通方不方便透露骁龙855的具体信息。不过,负责AI业务的高通产品管理总监Gary Brotman告诉智东西,目前高通芯片自研DSP不仅能非常高效地完成各种AI任务,而且非常灵活。
但从上一代骁龙845系列来看,高通已在其芯片中配置支持TensorFlow和Halide框架的六核移动DSP(数字信号处理器),并在几代之前就将其使用到异构计算和神经网络开发。
和华为、苹果的架构方案不同,下一代骁龙855很可能还是不会搭载独立NPU。上个月,Gary Brotman还告诉智东西,虽然高通内部有关于专用AI处理模块的研究进展,但AI算法发展飞快,芯片硬件设计往往一年半前就固定下来,一年半前的AI算法与今天完全不同,新算法出现后可能不适配于固定硬件,他认为暂时看不到搭载专用AI处理模块的手机芯片的意义。因此骁龙855很可能跟上一代骁龙芯片一样,具备更弹性的机器学习架构,分布在CPU、GPU、DPS等每个单元上,能适配市面上多种机型。
在智东西和高通Imagination、联发科以及华为海思等行业专家的采访过程中,我们得到一个普遍的结论,AI芯片确实是目前的行业趋势之一,随着手机差异化的减少,最终NPU将会变成“大家都得有”的东西。
据悉,麒麟980在配置上依然采用的是ARM架构,主频最高可达2.8GHz,CPU方面并没有太多的亮点,而其饱受诟病的GPU则有了较大升级。
就在上周的华为旗下手机品牌荣耀Note 10新品发布会上,荣耀总裁赵明公布了来自华为2012实验室的两项新技术:THE NINE液冷散热技术和和双Turbo技术(CPU Turbo+GPU Turbo)。
先于今年6月问世的GPU Turbo已经打通EMUI操作系统和GPU、CPU之间的处理瓶颈,使得图像处理骁龙提升60%,能耗降低30%,一扫之前在GPU表现上的颓势,缩短了和骁龙GPU的差距。
而此次首发的CPU Turbo得益于THE NINE液冷散热技术,把芯片产生的热量快速均匀分布到机身其他部位并迅速散发出去,整体散热性能提升41%,在激发CPU的极限性能的同时使CPU最高可降低10℃。
据传,麒麟980将首用华为自研GPU芯片,性能将是高通Adreno 630的1.5倍左右,在GPU Turbo加持下性能增长将达到50%-60%。如果麒麟980还配置上述THE NINE和CPU Turbo,AI计算效能可能持平甚至超越高通。
目前,苹果的A12处理器的核心数和架构信息还没有明确的消息。和华为一样,苹果AI芯片的主要短板之一也是GPU。根据前段时间曝光的跑分来看,A12在自研GPU方面做出了较大程度上的升级。
A12在GPU跑分提升至21619,比上一代A11的16000提高约三分之一,同时提高手机流畅度和散热能力。不过A12在CPU方面的提升似乎并不明显。
高通的Adreno GPU一直都是业界标杆,下一代高通芯片骁龙855的GPU传闻就更加恐怖了,据说“虐杀”一众竞争对手的Adreno 630还只是高通Adreno家族的中端低功耗产品,真正杀手级别的GPU是强化版的Adreno 640和堪比PC显卡的Adreno 680。按照高通发布新品的一贯节奏,骁龙855究竟采用哪款GPU可能到年底才会正式揭晓。
目前,苹果和华为的移动AI芯片都基于ASIC的深度学习,不仅能实现更高准确率,还比GPU、FPGA等传统通用芯片方案有更低的功耗。ASIC是全定制芯片,可基于AI算法进行定制,是未来AI芯片发展的主流方向。
与它们不同的是,骁龙AI芯片并不是直接叠加专用AI计算单元,而是在骁龙平台集成AI引擎,通过多核异构计算架构,让CPU、GPU、DSP等不同模块相互配合,根据不同应用场景安排工作负载。
三款芯片都将采用7nm工艺制程,其中麒麟980和苹果A12的代工订单都交给了台积电,而高通的制作公司暂时不确定是三星还是台积电。按照惯例,华为和苹果的发布会将发布新旗舰版手机,而台积电的处理器生产工作显得至关重要。
然而,近日据台媒报道,台积电工厂因病毒感染,导致数条生产线被迫中断,此次事件被波及的包括负责28nm、16nm和7nm制程的生产基地。目前,台积电官方做出简单回应,表示各大产线已恢复正常,停产时间不超过1天。对于晶圆厂而言,每次生产投入成本极高,一旦中断很可能造成严重损失。台积电此次停工是否会对苹果AI12芯片和麒麟980芯片的供应造成影响,目前尚不得而知。
根据此前台积电在股东会议上宣布的数据,2018年是7nm制程芯片大量投入生产的一年,跟之前的10nm FinFET工艺对比,7nm制程能够在相同晶体管数量下缩减70%的芯片DIE封装尺寸,将性能约提速20%,再加上升级之后可以减少功耗在40%左右。
日前,一颗疑似苹果A12处理器的跑分数据现身GeekBench 数据库,新机型号为iPhone11,2,预装iOS 12系统,处理器为六核设计,主频为2.49GHz。
苹果A12的单核性能4673分,相较上一代A11的4100分有所提升,其多核性能为10912分,和A11的10500左右得分持平,不过考虑到距离苹果发布会还有一段时间,这份跑分成绩并不会是A12的最终成绩单。
虽然麒麟980和骁龙855的具体跑分还不得而知,但从A12的跑分信息来看,和A12平起平坐还很困难。根据GeekBench 4数据猜想,麒麟980的单线程和多线程跑分分别约在3000分和7000分,而骁龙855的单线程和多线程得分分别约在3500分和9500分,相比之下,A12的性能表现已经相当出色。
功耗问题是手机芯片的核心问题之一,一块手机芯片无论有多强的算力,如果没有低功耗,依然面临市场的淘汰危机。在功耗方面高通仍然处于绝对优势。尽管7nm进程的工艺虽然在性能方面十分的强悍,但这可能会导致存在较为严重的发热问题,有网友爆料称A12的功耗比预期的还要高出23%,其高功耗问题还在解决中。
苹果A12的单核性能4673分,相较上一代A11的4100分有所提升,其多核性能为10912分,和A11的10500左右得分持平,不过考虑到距离苹果发布会还有一段时间,这份跑分成绩并不会是A12的最终成绩单。
虽然麒麟980和骁龙855的具体跑分还不得而知,但从A12的跑分信息来看,和A12平起平坐还很困难。根据GeekBench 4数据猜想,麒麟980的单线程和多线程跑分分别约在3000分和7000分,而骁龙855的单线程和多线程得分分别约在3500分和9500分,相比之下,A12的性能表现已经相当出色。
功耗问题是手机芯片的核心问题之一,一块手机芯片无论有多强的算力,如果没有低功耗,依然面临市场的淘汰危机。在功耗方面高通仍然处于绝对优势。尽管7nm进程的工艺虽然在性能方面十分的强悍,但这可能会导致存在较为严重的发热问题,有网友爆料称A12的功耗比预期的还要高出23%,其高功耗问题还在解决中。