2017 年 10 月 19 日,FPGA 发明者赛灵思在北京召开首届赛灵思开发者大会,机器之心受邀参加。在大会主题演讲中,赛灵思全球高级副总裁 Salil Raje 介绍了举办此次盛会的缘由——业务转型与广泛的商业应用。赛灵思通过主动的业务转型,引领着并支持着全可编程产品和技术广泛商用,即通过产品的高度集成和软件设计环境打造,把服务的对象从传统的面向硬件开发者扩展到应用软件和嵌入式软件开发者;并通过 4 个 FPGA 云加速器的具体商业应用案例展示了赛灵思全可编程产品应用领域的广泛拓展。
2017 年 10 月 19 日,赛灵思在北京举办首届赛灵思开发者大会(XDF,Xilinx Developer Forum)。赛灵思用户社区成员、开发团队、合作伙伴和行业专家齐聚一堂,共同出席了这个为期一天的交流、学习与分享的大会。赛灵思希望通过这种联系为设计提供启发,实现下一个成功设计。
赛灵思 ( Xilinx, Inc.,NASDAQ:XLNX ) 是 All Programmable FPGA、SoC、MPSoC、RFSoC 和 3D IC 全球领先供应商,独特地实现了既能软件定义又能硬件优化的各种应用,推动了云计算、5G 无线、嵌入式视觉和工业物联网等行业的发展。本次大会是一个面向应用层和用户案例的开发者活动,吸引了亚马逊、华为、阿里巴巴、百度、科大讯飞、深鉴科技等公司一起做主题演讲,内容覆盖深度学习、数据应用及云服务。
会议日程分为主会场和三个分会场,致力于满足不同类型开发者的各种需求。其中包括:1)应用软件开发者会场,支持通过使用可重配置逻辑和大规模并行加速机器学习、视觉、视频和基因组学等应用;2)嵌入式软件开发者会场,助力使用系统软件在单芯片上实现多处理器、异构或可重配置系统;3)硬件开发者会场,面向希望通过行业专家的最佳实践经验来提高生产力的正在使用 Vivado Design Suite HLx 版的硬件开发人员。赛灵思开发者大会将在包括北京在内的四座城市举行,北京是其第三站(前两站为硅谷、东京),下一站是明年 1 月份在法兰克福。
赛灵思软件和 IP 产品部高级副总裁 Salil Raje 做主题演讲
Salil Raje 表示,作为赛灵思首次全球开发者大会,和前两年举办的赛灵思 Club Vivado 用户大会相比,参会人员有一个大的变化,不再只有硬件开发者,还扩展到了软件开发者,包括应用软件和嵌入式软件。在硅谷和东京的前两场赛灵思开发者大会中,软件开发者人数超过硬件开发者。他相信北京会场也是同样情况,这其中原因是赛灵思业务的演化。
赛灵思业务演进
赛灵思正经历一个转型,大会反映了这一始于 6 年之前的转型。当时赛灵思就已经开始着手开发基于 C、C+、C++的开发工作,并在 C 语言转化为 RTL 方面保持领先,为后来转型埋下了种子。从 C 语言转换到 RTL 的高层次综合是赛灵思转型的核心,这包括高层工具和软件应用工具 SDSoC、SDAccel 等更加接近软件的设计环境;而高层次综合工具是这次转型的驱动器。从前赛灵思是一家传统的逻辑器件硬件公司,与 Altera 共同面向的主要用户是全球约 5 万人左右的硬件工程师和 FPGA 工程师。
这次转型体现在两个方面:芯片的高度集成与软件设计工具的打造。赛灵思在芯片上的集成度越来越高,比如引入了 Zynq MPSoC 多处理器片上系统;软件工具上也更多地在处理子系统基础上支持软件编程,并扩展到嵌入式软件设计领域。
通过上述两个方面的努力,赛灵思预计 5 年内潜在用户增加 5 倍,达到 25 万。其中包括通过 Zynq MPSoC 这样的多处理器 SoC 将传统的 5 万硬件工程师用户扩展到 10 万名 SoC 和 FPGA 工程师;通过打造软件堆栈- 面向云的可重配置加速堆栈(RAS)和面向端的 reVISION 堆栈,进一步将 10 万 SoC 及 FPGA 用户扩展到 25 万,涵盖广泛的从云到端软件和算法应用工程师。
软件堆栈让FPGA进入更多的市场
赛灵思的用 reVISION 堆栈(更多信息请参见:赛灵思推出 reVISION 堆栈,进军广泛的视觉导向机器学习领域)专门为全可编程技术进军广泛的视觉导向机器学习应用蓝海儿打造,主要针对自动驾驶汽车、无人机、监控和机器视觉等视觉导向的机器学习应用,目前已经在众多市场中扮演不可或缺的作用。
可重配置加速堆栈针对的则主要是超大型数据中心的 FPGA 加速应用,目前全球 7 大超大型数据中心已经有一般以上采用了赛灵思 FPGA 加速方案,其中包括亚马逊网络服务(AWS),阿里云,百度云,腾讯云,华为云也在今年 9 月在其云连接大会上宣布采用赛灵思推出 FPGA 云加速服务器,此次大会中更是把产品的介绍和演示带到了赛灵思开发者大会。
开发堆栈支持从端到云的应用
谈到赛灵思堆栈,主要是指 reVISION 和 RAS 可重配置加速堆栈。赛灵思从前专注做芯片,主要提供硬件及设计工具,现在这两个堆栈作为非常完整的链条和平台,可帮助软件开发者和器件进行完美的结合。
因此,赛灵思本来只提供芯片器件,现在则越来越多地提供开发板、平台以及软件驱动工具(比如 SDSoC 和 SDAccel,分别服务于终端和云端),以及软件架构(比如机器学习框架 Caffe、FFmpeg)。归根结底,赛灵思之所以推出软件堆栈、平台和开发板,是希望为用户提供高层面的解决方案,使其无需关注底层的硬件细节,无需具备专业的 FPGA 知识,就能实现理想的应用。如赛灵思所言,80% 的工作赛灵思已经做好,用户可以将 100% 的努力专注于 20% 可以让自己从竞争中脱衣而出的差异化创意。也正是因为此,赛灵思全可编程产品应用的门槛大大降低,并由此扩展至更多的用户。
以上是赛灵思最新的业务转型情况,那么其 FPGA 云加速器的具体商业应用又有哪些?
FPGA云加速器
上图中有 4 种 FPGA 云计算加速应用,也即是工作负载用 FPGA 加速,相对于服务器级 CPU 的一个情况。第一栏是语音识别中机器学习推断的加速应用,来自深鉴科技,加速倍数是 40。
NGCODEC 公司做视频解码,其 HEVC 编码帧速率方面加速达到 10 倍。RYFT 公司做大数据分析,提速是 90 倍。Edico Genome 公司做基因组,用 FPGA 加速也取得了非常好的结果,基因组分析提速达 100 倍。
机器学习,正在经历转变。一年以前机器学习重点是建立准确度更高的模型;现在情况发生了变化,提高模型准确度面临着边际效应递减的情况(最大障碍在计算这一块)。因此,目前机器学习领域,除了一方面维持精确度,另一方面也在提高效率,使部署更加简化。
高效、可扩展的机器学习
在模型效率提高方面,深鉴科技走在了行业前列。他们的计算机专家找到了提高模型效率的全新方法:第一,通过增建式修剪掉模型中影响力一般的部分,使其更小但效果更好;第二,模型变小之后对其压缩提高它的效率;第三,通过一个采用非常低精度数据的训练模型提高计算速度。
以上就是深鉴科技的关键业务及其差异化的优势,在这个过程当中他们发现 FPGA 是变现最好的载体,效率比 CPU 快 40 倍,比 GPU 快 3 到 4 倍。而且 FPGA 延迟非常低,这对于以推测为基础的机器学习来说非常重要,可以灵活适用于不同的机器学习应用模型。深鉴科技在这方面有一系列解决方案,效率非常高(注:10 月 24 日,深鉴科技在北京召开发布会,宣布 4000 万美元 A+轮投资,并发布了一系列最新 AI 产品,包括视频结构化解决方案、人脸分析解决方案、人脸检测识别模组、深鉴 ARISTOTLE 架构平台、深鉴深度学习开发 SDK 以及深鉴语音识别加速方案)。
此外,今天深鉴科技也希望通过赛灵思传达一个信息:他们已经做了语音识别 LSTM 模型和物体识别 CNN 模型,放在亚马逊云上,这个月可以免费试用。
视频流直播活动
视频编码处理同样需要 FPGA,其最初的市场是视频现场直播,比如体育赛事、电子竞技、美国棒球比赛。视频直播面向消费者,由于后者有很多选择,因此必须推出有效、有说服力的产品,保证视频质量和实时性(延时不能超过 8 秒),这是两个最起码的要求。
FPGA 非常适合满足这两项要求。它加速可以达到 CPU 的 10 倍,而且是动态可重配置的(比如根据网络流量情更换编码器),结束后又可以部署执行其他工作任务(比如机器学习、数据分析,基因组分析)。这是一个非常有吸引力、有说服力的解决方案,它执行非常大的工作量,同时非常有效率。因此,10 倍的加速是有巨大现实价值的应用,本来需要一万台服务器,用 FPGA 之后一千台就够了。
加速复杂的数据分析
如果现在在大数据和机器学习方面已经落后了,如何启动和追赶呢?一位麦肯锡专家的建议是首先把所有的数据尽可能地收集起来。这已不是一个行业秘密,有很多企业着手在做。绝大多数据是非结构的,无法与现有数据模式相吻合,没有清楚分类和方便的搜索。要实现这些数据最大的价值,必须从数据中尽可能地提取洞见,其中一个方法是用工具来对这些非结构性数据进行弹性搜索。
弹性搜索在企业应用最广泛,可用来找到需要的数据,同时分离噪音或者干扰数据,这是非常重要的一个搜索工具。RYFT 公司开发了一款可使弹性搜索加速 90 倍的应用。上图中的红线是亚马逊 EC2 上未加速的弹性搜索,使用的是非常强大的 CPU 服务器;1T 的数据分析需要 62 个小时;如果采用 RYFT Cloud,提速可高达 90 倍。
通过 FPGA 实现的加速其实是借助了弹性搜索的一个性质。弹性搜索有两种不同的搜索方式,一种是精确搜索,一种是模糊搜索。两种搜索方式要求两种算法,RYFT 分别为其定制了不同的加速器。当然,不只有两种算法,还有其他很多算法,RYFT 针对每种算法有定制的加速器,每跑一次,动态重新配置确保在 FPGA 加速的过程中,能够使用到最合适的芯片完成这个任务。
实现个性化医疗
个性化医疗希望能从细胞和基因层面了解人类。如果做到这一点,就能够实现更加精准更有针对性的治疗,甚至开发出针对某一个人的药物。当然前提是必须能以非常经济、快速的方式来做基因组测序和基因学分析。赛灵思认为最需要这种精度和速度的医生就是那些治疗危重新生儿的医生,他们的一个非常重要的工具就是基因组测序和基因学分析,但是这个结果必须很快出来。Edico Genome 公司可以把这一时间从 5 到 35 小时缩短至 20 分钟。
Edico 从 FPGA 加速中获益更大,比如其产品 DRAGEN 的不同模块可根据不同算法进行定制,像 RYFT 一样,通过动态可重新配置技术确保做每一种算法、执行每一项任务时,都能采用最佳的算法。
那么,Edico 的案例对于赛灵思意味着什么呢?就是赛灵思只需要很少数量的云服务供应商,比如只要亚马逊一家便可连接到几千家企业和几百万用户。FPGA 的可重配置性、灵活性和广泛用途对于云服务供应商来说都是非常有价值的特点。
赛灵思开发者大会希望与这些云生态、应用进行连接,让大家进行交叉授粉式的化学反映,更好地利用自身算法获取价值,并通过云实现规模化。
]]> 原文: http://ift.tt/2xpvbdA |
没有评论:
发表评论