2018年9月1日星期六

三年研发、数亿美元投入、7nm手机芯片,揭秘非卖品麒麟980

安妮 发自 凹非寺量子位 出品 | 公众号 QbitAI

昨晚,华为麒麟980芯片发布。

作为全球首款量产的7nm手机芯片、首款基于最新Cortex-A76 而开发的商用芯片、首款搭载Mali-G76 GPU架构的移动端芯片、双NPU加持……有人形容980"性能强悍到可怕"。

而且在性能提升的同时,980在能效表现上也实力不俗。据TMSC的官方数据统计,相比主流10nm手机芯片,980能效提升了40%,也有人形容980是"能效小怪兽"。

这样一款芯片,是怎么炼成的?

7nm跃升的CPU

麒麟980是全球首款量产的7nm手机芯片。

7nm工艺和10nm相比,有什么提升?

根据台积电发布的数据,7nm能进一步提升约20%的性能,提升约40%的能效,逻辑电路的密度提升60%。一颗980内部,集成了69亿个晶体管。

我们来做个对比。

2014年,华为发布的920芯片采用了28nm制程,当时集成了约20亿个晶体管;2015年,华为推出采用16nm工艺FinFET制造的950芯片,当时有约30亿个晶体管;2017年,华为发布10nm工艺的970芯片,集成55亿个晶体管。

除了不断采用最新工艺,这次的980还是华为首次基于Cortex-A76开发而成的CPU,性能提升75%,同时效能提升58%。

Kirin CPU子系统推出了Flex-Scheduling智能调度机制,创造性地设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构,提供了更为精准的调度层次,让CPU在重载、中载、轻载场景下灵活适配,让用户获得更高性能体验的同时获取更长的续航体验。

超大核是用来处理急速的性能,而大核用于持续的性能,小核就是用于日常的使用。在华为Flex-Scheduling智能调度机制的帮助下,可以根据用户的使用情况,智能调度使用不同的核心。比如听音乐调用一个小核,打游戏调用大核。

更快更省的GPU

当然,打游戏更需要GPU的支持。

这次980上的GPU性能提升了46%,但是能效不但没有降低,而且提升了178%,也就是说能效是以前的两倍多。对于游戏玩家来说,是个好消息。

华为以大型重载游戏NBA2K18举了个例子。

"麒麟980基本上能够达到59.3帧/秒,接近60帧,而且加上GPU Turbo后可以保持基本稳定持续在60帧。而竞争对手,如果我们给他测5分钟、10分钟,大概是40多帧,如果给它测半个小时,掉到30多帧"。

此外,980每帧的功耗是43.7毫瓦,而主要竞品的功耗为60多毫瓦。

980里还集成了新的双ISP(图象处理单元)4.0,与上一代相比,像素吞吐率提升46%、能效提升23%。在Pipeline技术的加持下,时延降低了33%,这是啥意思?直白的说,对焦更快、拍照响应时间更短。

3年,1000多人

没有一蹴而就的成果,我们目前看到的麒麟980成品,其实是华为36个月前布下的局。

2015年,华为开始投身7nm芯片的研究,当主流智能手机尚处于20或28nm工艺制程之时,华为动身研发7nm技术了,同年还开始了IP储备。一年多以后,华为团队着手SoC工程化的验证工作,到今年,麒麟980终于量产。

在深耕7nm的这两年,华为总共投入了1000多名半导体设计工程师和工艺专家,进行了5000多次的工程验证。

华为表示,作为一个芯片,除了设计,工艺,还有软件、硬件协同之外,大量的工程化的难题还需要大量的验证,相比于其他行业,芯片的投资耗时更长,且人才需求量大。

除了高额的时间和人力投入,麒麟980能问世还有一个必须因素:

钱。

3亿美元?不存在的

在麒麟980发布之前,关于研发成本的各种传言早已满天飞。其中最多的议论,是说麒麟980前期的开发、验证和测试费用高达3亿美元。针对这个问题,量子位向华为求证。

对方否认了外界的说法:

我不知道3亿那个数是哪来的,数亿美元应该有吧,但是具体的数目我们也不好界定。

因为这是一个很长的过程,一是从研发的哪个阶段开始算比较好很难说,二是其中有一部分工作会有交叉重合,那怎么算呢?

总体来说,这是一个复杂的问题。再加上它是滚动开发的,所以在开发这款产品的时候,也在开发下一代产品,所以有些投入不是那么的清晰。外界传闻的3亿美元不知道哪里来的。

"非卖品"

对于外界关注的投入产出比,华为认为这并不是内部看重的点。从研发芯片至今,除极少数芯片外,大部分芯片并不会对外授权,是不折不扣的"非卖品"。

华为表示,公司并没有将芯片定位为一块独立的业务,这个指标并不在考虑的范围,更无所谓营收。

"我们不会基于芯片对外创造收入,华为自己做芯片仅仅定位来承载我们的硬件架构,来实现我们的产品的差异化、竞争力以及低成本。到现在为止我们没有任何想法和计划把麒麟芯片对外销售。"华为轮值董事长徐直军在今年的分析师大会上表示。

可以看出,华为的打法和独立的芯片公司并不相同。

独立芯片厂商会提前半年一年发布新品,告诉大家芯片的能力,让客户把芯片平台上的能力真正变成产品。相比之下,华为具备垂直整合、自顶向下的产品定义的能力,偏向将最优的特性快速的在产品上实现,并且消费者能够用到。

"所以华为没有像有些厂商那样提前那么久发布新的芯片平台。产品基本在芯片发布后就出来了,大家也能体验到了,这就是策略的不一样。"华为表示。

不为盈利那为何?

"华为更多的是看重产品的竞争力,这更无形一些。从当前华为CBG发展的情况来看,从产品竞争力和品牌影响力上来看,芯片的投入非常有价值。"

华为在麒麟980上的投入,即将在一个半月后迎来"结果"。首款搭载华为麒麟980的手机——华为Mate 20系列,将于10月16日在伦敦发布。届时,华为麒麟980的"恐怖性能",将会直接作用于用户体验层面,给消费者带来直观的价值感知。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2PXwvhk
RSS Feed

RSS5


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

50张图片做出李飞飞数万张的效果,类脑AI竟然这样玩?

郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI

这张毛色艳丽"星空猫",在经过图像处理之前长这样:

没有了迷幻背景和油画般的毛色,顿时变成了三只"凡猫"。

一个不懂GAN也不会PS的普通人,完成这样的图像处理要几分钟?

在微信通讯录里锁定设计师大神……1分钟;组织语言求大神帮忙……5分钟;等大神回复……30分钟;大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说,只要点几下屏幕就够了。

上传原图,APP自动抠出三只猫;把背景和猫的渲染风格都设置成星空;降低猫的亮度,提高猫的对比度。

三步完成只有设计师才能做出的效果,依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家"沉迷"类脑的AI公司

马卡龙玩图APP之前的名字叫Versa,和背后的这家公司的名字一样。

作为一家专做"P图"的AI创业公司,Versa的研究方向和别家不同:

不做大数据人工智能,专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同,是机器学习的另一个分支,研究类脑计算,以及概念表示、迁移与生成,和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络,类脑人工智能可以实现和人类小孩认识世界类似的能力,仅仅通过少量数据就可以实现一些效果。

比如说,李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer

and Super-Resolution》用到的方法,实现每种风格需要4~8万张图片来进行训练,而Versa的通过类脑人工智能进行风格迁移,每种风格只需要50张图片就可以了。

△ Gatys和李飞飞的风格迁移效果图

概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子,概念迁移是指可以将颜色、形状等基础概念,加上语义,拼接成复杂概念。

作为一家以P图为核心的公司,类脑人工智能便于实现概念迁移的特点也让Versa在"抠图"这个步骤中取得了优势,赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点,达到了95.7%。

类脑人工智能的第三个优势"无中生有"被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象,类脑人工智能"脑补"出景深,可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。

目前,赵维杰不仅是Versa的CTO,还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年,赵维杰就已经开始研究类脑人工智能方向了。

在他看来,依靠大数据的人工智能只能解决一小部分问题,比如图像识别等;而在更广阔的应用场景中,人们无法获得如此大量的数据,只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力,更让研发的速度足够快。"任意一个基于脑科学的AI公司,都非常容易建立起长期的技术壁垒,"赵维杰说,"假设说现在我们的图像分割算法可能领先行业六个月的话,那我们下一个算法一定领先行业要一年。"

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意,而是服务更多人、更加多元化的文化产业,通过便捷的图像处理,让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许,这也是一个AI创业的灵感:谁说底层技术必须服务于B端?

赵维杰告诉量子位,目前Versa在APP端已经拥有1200万用户,未来准备继续在C端通过马卡龙玩图APP服务普通用户,在B端通过Adobe插件的形式,服务专业的设计师,让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能,名叫inpainting,可以一键P掉照片里的人物。

注意"仙人洞"中的那个白衣女子。

不见了。

另外,他们还准备把"抠图"功能应用在视频里,比如把这样一段电影:

变成这样:

你觉得效果如何?

最后,读者朋友们对类脑人工智能怎么看?欢迎评论区留言。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2MJLOMU
RSS Feed

RSS5


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

三年研发、数亿美元投入、7nm手机芯片,揭秘非卖品麒麟980

安妮 发自 凹非寺量子位 出品 | 公众号 QbitAI

昨晚,华为麒麟980芯片发布。

作为全球首款量产的7nm手机芯片、首款基于最新Cortex-A76 而开发的商用芯片、首款搭载Mali-G76 GPU架构的移动端芯片、双NPU加持……有人形容980"性能强悍到可怕"。

而且在性能提升的同时,980在能效表现上也实力不俗。据TMSC的官方数据统计,相比主流10nm手机芯片,980能效提升了40%,也有人形容980是"能效小怪兽"。

这样一款芯片,是怎么炼成的?

7nm跃升的CPU

麒麟980是全球首款量产的7nm手机芯片。

7nm工艺和10nm相比,有什么提升?

根据台积电发布的数据,7nm能进一步提升约20%的性能,提升约40%的能效,逻辑电路的密度提升60%。一颗980内部,集成了69亿个晶体管。

我们来做个对比。

2014年,华为发布的920芯片采用了28nm制程,当时集成了约20亿个晶体管;2015年,华为推出采用16nm工艺FinFET制造的950芯片,当时有约30亿个晶体管;2017年,华为发布10nm工艺的970芯片,集成55亿个晶体管。

除了不断采用最新工艺,这次的980还是华为首次基于Cortex-A76开发而成的CPU,性能提升75%,同时效能提升58%。

Kirin CPU子系统推出了Flex-Scheduling智能调度机制,创造性地设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构,提供了更为精准的调度层次,让CPU在重载、中载、轻载场景下灵活适配,让用户获得更高性能体验的同时获取更长的续航体验。

超大核是用来处理急速的性能,而大核用于持续的性能,小核就是用于日常的使用。在华为Flex-Scheduling智能调度机制的帮助下,可以根据用户的使用情况,智能调度使用不同的核心。比如听音乐调用一个小核,打游戏调用大核。

更快更省的GPU

当然,打游戏更需要GPU的支持。

这次980上的GPU性能提升了46%,但是能效不但没有降低,而且提升了178%,也就是说能效是以前的两倍多。对于游戏玩家来说,是个好消息。

华为以大型重载游戏NBA2K18举了个例子。

"麒麟980基本上能够达到59.3帧/秒,接近60帧,而且加上GPU Turbo后可以保持基本稳定持续在60帧。而竞争对手,如果我们给他测5分钟、10分钟,大概是40多帧,如果给它测半个小时,掉到30多帧"。

此外,980每帧的功耗是43.7毫瓦,而主要竞品的功耗为60多毫瓦。

980里还集成了新的双ISP(图象处理单元)4.0,与上一代相比,像素吞吐率提升46%、能效提升23%。在Pipeline技术的加持下,时延降低了33%,这是啥意思?直白的说,对焦更快、拍照响应时间更短。

3年,1000多人

没有一蹴而就的成果,我们目前看到的麒麟980成品,其实是华为36个月前布下的局。

2015年,华为开始投身7nm芯片的研究,当主流智能手机尚处于20或28nm工艺制程之时,华为动身研发7nm技术了,同年还开始了IP储备。一年多以后,华为团队着手SoC工程化的验证工作,到今年,麒麟980终于量产。

在深耕7nm的这两年,华为总共投入了1000多名半导体设计工程师和工艺专家,进行了5000多次的工程验证。

华为表示,作为一个芯片,除了设计,工艺,还有软件、硬件协同之外,大量的工程化的难题还需要大量的验证,相比于其他行业,芯片的投资耗时更长,且人才需求量大。

除了高额的时间和人力投入,麒麟980能问世还有一个必须因素:

钱。

3亿美元?不存在的

在麒麟980发布之前,关于研发成本的各种传言早已满天飞。其中最多的议论,是说麒麟980前期的开发、验证和测试费用高达3亿美元。针对这个问题,量子位向华为求证。

对方否认了外界的说法:

我不知道3亿那个数是哪来的,数亿美元应该有吧,但是具体的数目我们也不好界定。

因为这是一个很长的过程,一是从研发的哪个阶段开始算比较好很难说,二是其中有一部分工作会有交叉重合,那怎么算呢?

总体来说,这是一个复杂的问题。再加上它是滚动开发的,所以在开发这款产品的时候,也在开发下一代产品,所以有些投入不是那么的清晰。外界传闻的3亿美元不知道哪里来的。

"非卖品"

对于外界关注的投入产出比,华为认为这并不是内部看重的点。从研发芯片至今,除极少数芯片外,大部分芯片并不会对外授权,是不折不扣的"非卖品"。

华为表示,公司并没有将芯片定位为一块独立的业务,这个指标并不在考虑的范围,更无所谓营收。

"我们不会基于芯片对外创造收入,华为自己做芯片仅仅定位来承载我们的硬件架构,来实现我们的产品的差异化、竞争力以及低成本。到现在为止我们没有任何想法和计划把麒麟芯片对外销售。"华为轮值董事长徐直军在今年的分析师大会上表示。

可以看出,华为的打法和独立的芯片公司并不相同。

独立芯片厂商会提前半年一年发布新品,告诉大家芯片的能力,让客户把芯片平台上的能力真正变成产品。相比之下,华为具备垂直整合、自顶向下的产品定义的能力,偏向将最优的特性快速的在产品上实现,并且消费者能够用到。

"所以华为没有像有些厂商那样提前那么久发布新的芯片平台。产品基本在芯片发布后就出来了,大家也能体验到了,这就是策略的不一样。"华为表示。

不为盈利那为何?

"华为更多的是看重产品的竞争力,这更无形一些。从当前华为CBG发展的情况来看,从产品竞争力和品牌影响力上来看,芯片的投入非常有价值。"

华为在麒麟980上的投入,即将在一个半月后迎来"结果"。首款搭载华为麒麟980的手机——华为Mate 20系列,将于10月16日在伦敦发布。届时,华为麒麟980的"恐怖性能",将会直接作用于用户体验层面,给消费者带来直观的价值感知。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2PXwvhk
RSS Feed

RSS5


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

50张图片做出李飞飞数万张的效果,类脑AI竟然这样玩?

郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI

这张毛色艳丽"星空猫",在经过图像处理之前长这样:

没有了迷幻背景和油画般的毛色,顿时变成了三只"凡猫"。

一个不懂GAN也不会PS的普通人,完成这样的图像处理要几分钟?

在微信通讯录里锁定设计师大神……1分钟;组织语言求大神帮忙……5分钟;等大神回复……30分钟;大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说,只要点几下屏幕就够了。

上传原图,APP自动抠出三只猫;把背景和猫的渲染风格都设置成星空;降低猫的亮度,提高猫的对比度。

三步完成只有设计师才能做出的效果,依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家"沉迷"类脑的AI公司

马卡龙玩图APP之前的名字叫Versa,和背后的这家公司的名字一样。

作为一家专做"P图"的AI创业公司,Versa的研究方向和别家不同:

不做大数据人工智能,专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同,是机器学习的另一个分支,研究类脑计算,以及概念表示、迁移与生成,和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络,类脑人工智能可以实现和人类小孩认识世界类似的能力,仅仅通过少量数据就可以实现一些效果。

比如说,李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer

and Super-Resolution》用到的方法,实现每种风格需要4~8万张图片来进行训练,而Versa的通过类脑人工智能进行风格迁移,每种风格只需要50张图片就可以了。

△ Gatys和李飞飞的风格迁移效果图

概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子,概念迁移是指可以将颜色、形状等基础概念,加上语义,拼接成复杂概念。

作为一家以P图为核心的公司,类脑人工智能便于实现概念迁移的特点也让Versa在"抠图"这个步骤中取得了优势,赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点,达到了95.7%。

类脑人工智能的第三个优势"无中生有"被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象,类脑人工智能"脑补"出景深,可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。

目前,赵维杰不仅是Versa的CTO,还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年,赵维杰就已经开始研究类脑人工智能方向了。

在他看来,依靠大数据的人工智能只能解决一小部分问题,比如图像识别等;而在更广阔的应用场景中,人们无法获得如此大量的数据,只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力,更让研发的速度足够快。"任意一个基于脑科学的AI公司,都非常容易建立起长期的技术壁垒,"赵维杰说,"假设说现在我们的图像分割算法可能领先行业六个月的话,那我们下一个算法一定领先行业要一年。"

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意,而是服务更多人、更加多元化的文化产业,通过便捷的图像处理,让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许,这也是一个AI创业的灵感:谁说底层技术必须服务于B端?

赵维杰告诉量子位,目前Versa在APP端已经拥有1200万用户,未来准备继续在C端通过马卡龙玩图APP服务普通用户,在B端通过Adobe插件的形式,服务专业的设计师,让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能,名叫inpainting,可以一键P掉照片里的人物。

注意"仙人洞"中的那个白衣女子。

不见了。

另外,他们还准备把"抠图"功能应用在视频里,比如把这样一段电影:

变成这样:

你觉得效果如何?

最后,读者朋友们对类脑人工智能怎么看?欢迎评论区留言。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2MJLOMU
RSS Feed

RSS5


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧!- InfoQ 每周精要848期

「每周精要」 NO. 848 2024/09/21 头条 HEADLINE JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧! 精选 SELECTED C++ 发布革命性提案 "借鉴"Rust...