2017年11月6日星期一

在「古板迟缓」的芯片产业,一群「寒武纪」们诞生的意义与挑战

撰文 | 宇多田


在过去的几年里,一个名为「深度学习」的人工智能技术家族在科技行业掀起了一场风暴。


从帮你对手机相册里的自拍与萌宠进行识别分类,再到大幅度提高 Alexa 们(智能助手)与无人驾驶汽车的「平均智商」,「深度学习」这个人工智能里的门类,具备了更高级的对「复杂结构」进行自动挖掘的能力。


通俗来说,与传统计算通过固定流程解决「确定」问题不同,深度学习算法需要模拟人脑来解决那些取决于概率的「不确定问题」。


而这个解决问题过程所需的算力,却与传统芯片所擅长的不一致。


因此,各类终端,乃至整个智能硬件市场,对底层基础芯片的要求也发生了根本改变。简单来说,就是处理器性能与需求之间出现了巨大的市场缺口。


而这正是为何从英伟达、英特尔等老牌半导体巨头,再到 Cerebras Systems、Wave Computing 等明星AI 芯片初创公司,都在竞相开发供 AI 算法专用的芯片。


从某种意义上,这些芯片能够根本改变计算机的制造方式。


而在这些恰逢其时出现的idea与创业公司中,就包括最近风头正劲的全球第一家芯片独角兽——中国创业公司「寒武纪」。


「寒武纪」们的机会


当下,在很大程度上,深度学习芯片市场是由英伟达主导的。


这家芯片巨头长期以来一直以其「王牌产品」——图形处理器(GPU)而闻名业界。而 GPU 有成千上万个并行的微型计算机,每个都在「专心」地渲染像素。


通常,为了渲染图像的阴影、光线、反射以及透明度,这些小的计算「核心」需要一起执行大量低级的数学运算。


而就在几年前,研究人员又发现,GPU 的功能理论上非常适合运行深度学习算法,因为后者也需要成千上万地并行计算,正迫切需要一款适合的芯片来高效计算深度学习任务。


而这一发现,让 GPU 的出现显得恰逢其时,也让英伟达成功成为人工智能革命的「核心发起人」之一。


不过,虽然这些 GPU 在游戏和其他图像密集型应用中被广泛使用,但是从英伟达近年来的财报可以看出,数据中心的业绩虽然增幅很大,但从GPU在人工智能领域的整体情况来看,并不是非常理想。


特别是2017年第一财季,这项业务同比增长了186%,占总营收的20%。




而在智能终端芯片市场,英伟达并不是明显的赢家。


换句话说,终端市场中的各种垂直场景,包括手机、智能家居、安防、自动驾驶等领域,都存在 AI 芯片创业公司切入的大量机会。



(请注意,游戏领域并不算是GPU在人工智能领域的应用)


而另一个让创业公司「有利可图」的理由,在于通用芯片与专业芯片的差异性。同花顺财经对这个「差异性」有一个非常形象的比喻:


GPU 是一种通用型芯片,就像是你买了一个格局都固定了的房子,然后改变内部的软件设施来让这个房子达到我们需要的功能,优点是对于用户代价小,但肯定没法达到性能最大化。换句话说,就是计算力有限,性能不够。


而专业性的 ASIC 芯片,譬如嵌入华为麒麟 970 芯片的寒武纪 1A 处理器,就像是完全一块砖一块砖按自己需求重新搭建一个房子,这种肯定在性能上最贴近我们的需求,但是一次性投入太大,如果不是某一确定需求,或者能够有足够大的市场规模,肯定要冒风险。




从目前来看,虽然 GPU 的性能已经大大高于传统的 CPU,但是对于功耗较小的终端设备(譬如手机)来说,GPU 的计算力可能仍然不能满足一些需要高效运算的 AI 应用。


因此,一种目前许多终端公司与研究机构在采用的解决方法是,通过硬件加速,采用专用协处理器的异构计算方式来提升处理性能。通俗点来说,就是通用与定制化芯片可以「共存」在一个终端里。


以华为 Mate10 为例,其麒麟 970 芯片的 HiAI 移动计算架构就是由 CPU、GPU、ISP/DSP 和 NPU(寒武纪 1A 处理器)四部分组成。


Mate10 上的一款微软翻译 app,就是基于 NPU 的强大运算性能,将翻译速度提升了 300%,还能实现离线可用的全神经网络机器翻译。


因此,对于芯片创业公司来说,做的「更专」,针对特殊场景和需求进行更多特别的设计,反而是在这个市场进行「弯道超车」的好选择。




目前,从全球来看,大多数芯片创业公司,都是选择了先设计并制造「定制化芯片」的方式来切入市场。


譬如由一群具有传奇色彩的美国芯片业老兵 Andrew Feldman 等人在 2016 年成立的深度学习芯片制造商 Cerebras,就是这样一家公司。


虽然其研发及主体业务一直处于秘密状态,但据消息人士透露,他们的芯片就是为「训练某些 AI 算法模型」而量身定制的。


像 Cerebras 这样的芯片创业公司们相信,自己完全有能力在深度学习应用程序中构建一些优于 GPU 的芯片。作为 Cerebras 的 CEO,Feldman 曾在一次采访中指出,GPU 只是用来生成图形的:


「我不认为 GPU 适用于深度学习,」费尔德曼表示,「它可能比英特尔的 (CPU) 要好,但 GPU 只是代表了一种 25 年来传统芯片针对不同问题的优化结果。」


而许多其他正在崛起的 AI 芯片公司基本都在遵循着 Feldman 的逻辑:他们设计的下一代芯片有着「多核心」的特色,而每个核心都是针对低精度运算。


譬如总部位于加州坎贝尔市的创业公司 Wave Computing,就在最近披露了自己芯片架构的细节——他们在一个被称为「WDPU」的芯片上有 16000 个核心。


而另一家总部位于英国布里斯托的芯片创业公司 Graphcore 则表示,其名叫的 IPU 的芯片上载有 1000 多个核心。




再转向国内,作为全球唯一一家芯片独角兽,诞生于中国科学院计算技术研究所,成立于 2016 年的寒武纪,早在去年就推出了一款名为「1A处理器」的商用深度学习专用处理器(NPU)(神经网络处理器)。


而最值得注意的是,这块具备了传统四核CPU25倍以上性能的专用芯片,主要针对计算机视觉、语音识别等方面的任务。

另外,在今天举行的寒武纪发布会上,CEO 陈天石宣布在 2017 年 3 季度上市的寒武纪 1H8 处理器,主要面向场景视觉的应用;而上市时间「保密」的寒武纪 1M 处理器,则主要面向智能驾驶领域。


总体来说,寒武纪现有以及即将上市的芯片旗舰产品,都只针对一些特定的垂直场景,且运行智能算法时的性能与计算效率,都要大幅超越 CPU 与 GPU。




芯片创业公司的骄傲与挑战


毫无疑问,这个产业的投入非常庞大,而且资金必须可持续。就像 ARM 中国战略发展总监袁伟的表述一样:「芯片研发与制造的投入必须要达到 10 亿美金的级别,基本上只有巨头能担负得起」。


但很显然,资本似乎对这种「费钱」的现实「无动于衷」。


因为从某种程度上,英伟达如今疯狂飙升至 1000 亿美元的市值对投资者们产生了极大的冲击,没有人不对 AI 芯片在商业领域展现出的想象空间垂涎欲滴。


这种意识让投资者在面对 AI 芯片创业者时并没有捂紧钱包,当下,资本正在源源不断地流入这个「又见生机」的古老产业。


以刚刚提到的神秘芯片创业公司 Cerebras 为例,根据资本数据库 PitchBook 提供的融资文件显示,在其结束的三轮融资中,Cerebras 已经筹集了 1.12 亿美元,其估值也在今年8月飙升至高达 8.6 亿美元。


而 Wave Computing 与 Graphcore 迄今为止也分别筹集了 6000 万美元。投资者们包括 DeepMind CEO Demis Hassabis,Uber 首席科学家 Zoubin Ghahramani 以及一些来自 OpenAI 的管理层。


「我们刚刚宣布成立 AI 芯片公司,就被那些对我们产品感兴趣的人的电话打爆了,」Graphcore 的首席执行官兼联合创始人奈杰尔·图恩 (Nigel Toon) 的这番说法既无奈又骄傲,「我们甚至可以和任何 AI 领域的关键人物进行沟通和谈判。」


而刚刚发布了新产品的寒武纪,也是在今年 8 月份获得 1 亿美元 A 轮融资金额,晋升为全球首个芯片独角兽后,开始受到国内的广泛关注。值得注意的是,阿里巴巴、联想等计算巨头都是其重要投资方。



寒武纪CEO陈天石


更大的投入与回报,更令人兴奋的市场,自然也涌动着更大的危险与挑战。


福布斯杂志就曾对这个不断砸钱的市场发出疑问:适合这些芯片的硬件真的成熟了吗?


以无人驾驶汽车为例,大部分零部件仍处于开发阶段与早期试点阶段。


还有就是,即便你花费数年时间研发出一款芯片,但是否能够适应算法及硬件变迁的节奏呢?


特别是对于定制化的 ASIC 芯片来说,算法是固定的,一旦算法变化就可能无法使用。目前人工智能还属于大爆发时期,大量算法不断涌出,远没到算法平稳期,ASIC 专用芯片如何做到适应各种算法是个最大的问题。


因此,像寒武纪这样的公司,虽然以一款深度学习专用芯片为切入点,但公司显然已经在朝着制造更通用芯片的道路迈进了。


譬如,今天寒武纪也在最后顺延推出了一款面向云端的机器学习处理器 MLU,而陈天石也在接受采访时否认了寒武纪是一家制造 ASIC 芯片的公司:


「我们不只有神经网络处理器 ,还会在未来发布适用于更多任务的处理器产品。」



可以看到,MLU涉及了数据中心业务


此外,虽然英伟达让人们看到了 AI 芯片的巨大商机,但我们从目前来看根本不清楚芯片创业公司的商业机遇究竟有多大。

尽管有英伟达在先,但通过芯片产品进入以计算为基础的数据中心市场仍然是一个不容忽视的大目标,因为这是一个随着云计算产业爆发而变得十分有利可图的市场。


但这一市场基本被亚马逊、谷歌、微软、苹果、Facebook 等美国计算巨头所主导。而谷歌也因为 GPU 的功耗问题,开发了属于自己的 AI 芯片 TPU;微软也似乎正在专注使用一种叫做 FPGA 的可编程芯片。




而另一个明显的挑战,在于芯片创业公司独立成长壮大的「高难度」。


在过去几年中,半导体行业经历了大规模的并购整合浪潮,所有芯片巨头对待新事物都十分警惕——在积极寻找下一个可以赚钱的「Big Thing」同时,也在把「一切威胁地位的苗头」无形扼杀于摇篮里。


可以看出,他们大多数的收购目标都瞄准了专注于人工智能计算与自动驾驶等场景的专业级公司。特别是芯片巨头英特尔,其并购套路一直是极具「侵略性」的:

  • 耗资 187 亿美元收购 FPGA(可编程芯片)制造商 Altera;
  • 花 150 亿美元买下自动驾驶系统制造商 Mobileye;
  • 花 3.5 亿美元收购深度学习技术公司 Nervana。

而英特尔的竞争对手高通,正试图以 380 亿美元的价格,与在汽车市场具有绝对话语权的芯片制造商 NXP 进行合并。


高通创投的 CEO Quinn Li 曾透露,公司其实已经研究了像 Cerebras 这样的 AI 芯片公司很长时间,但是因为一些不确定因素还没有进行下一步动作。


「尤其是在供数据中心使用的芯片市场,我们还尚未进行任何投资。每个人都很明白,

在数据中心领域的潜在客户数量有限,而进入一个由英伟达把控的市场会非常困难。而在终端设备领域,由于硬件还不是很成熟,市场规模还远远没有达到想象的样子。」


他坦白,高通也正在试图弄清楚市场机会是什么。「最赚钱的仍然是数据中心领域,或许亚马逊和其他没研发 AI 芯片的大公司会对更新,价格更低性能更好的产品感兴趣。」




(以上为寒武纪的商业目标)


从寒武纪的产品角度来看,与国外同类创业公司相比,这家中国芯片创业公司已经率先进入了商业化流程——其 IP 指令集,已扩大范围授权集成到手机、安防、可穿戴设备等终端芯片中,截止 2016 年已拿到 1 亿元订单。


不过,寒武纪另一个突出优势在于有着「国家战略」的支持,其「中国芯」的宣传口号与国家科技部门对公司进行的专题调研以及学院背景就可见一斑。

但无论如何,你不能否认的是,在这个古老且传统的半导体产业中,AI 在芯片上的突破与寒武纪们的出现,是彻底改变传统市场「赛制」,进行市场洗牌,与加速 AI 产业化的重要机会。


]]> 原文: http://ift.tt/2h7KuRG
RSS Feed

机器知心

IFTTT

为静态照片添加动画表情的iOS应用MugLife来了,网友惊呼「这技术等着被收购吧」

撰文 | 王艺


机器之能最近发现了一个很好玩的图片处理 APP,叫 Mug Life,简单几步就能让人物照片动起来,我们先来看看效果。


Mug 前:



Mug 后:



为了能让脸部动起来,Mug Life 提供了一些表情的模版,且几乎每天都有新表情上线。如果你想要自己创作,Mug Life 还支持用户自己设计面部锚点的移动路径。


你可以把它理解成低配版的「反向 iPhone X Animoji」。之所以反向,是因为 Animoji 是将人类的表情按在动画上,而 Mug Life 是将模版的表情套在人物上。


为什么是低配?因为所有的 iOS 用户都能使用,并不需要 3D 摄像头。不过或许是因为 Animoji 的处理对象是一些特定的卡通人物,与 Mug Life 需要处理的五花八门的人物照片相比,难度较低。因此,与 iPhone X 的效果相比,Mug Life 确实稍逊一筹。


Animoji:


Mug 前:



Mug 后:



有的时候 Mug Life 还是会识别无能,比如人物戴帽子的时候。


Mug 前:(小汤圆友情出镜)


Mug 后:


对于眼镜的处理也还需要加强


Mug 后:


不过目前图像处理软件大多是像 Faceu 一样,在视频或者照片上直接加特效,像 Mug Life 这种将照片变成视频的 APP 的确是一股清流。


有了 Mug Life,恶搞亲朋好友名人明星不在话下(当然要懂得遵纪守法)。而且 Mug Life 不仅能 Mug 人脸,还能 Mug 小猫小狗的脸,Mug 起哈士奇来也是魔性。


Mug 前:(图片源自知乎,版权所有:独角白七)


Mug 后:


与此同时,Mug Life 还是一个社区,用户向社区上传他们的 Mug 作品,也可以免费下载社区内其他用户上传的内容。如果你上传的内容不想被他人下载的话,可以设置为私有模式。


Mug Life 成立于 2015 年,创始人 Rob Cohen 和 Thomas Coles 曾是 20 年的老同事,二人均在视频游戏产品界占有很高的地位。


在创立 Mug Life 之前,Cohen 曾在 1998 年创立 PC 游戏「现实边缘」,并任 CEO 和 CTO。Coles 则热爱建筑与艺术,是 Mug Life 的艺术家和创意总监。


想必大家也看出来了,Mug Life 背后的技术正是现在大热的神经网络。其技术实现分为三个阶段——面部解构(Deconstruction)、加特效(Animation)、以及面部重构(Reconstruction)。


据官网介绍,在解构阶段,Mug Life 将照片分解,提取 3D 建模所需的要素,例如相机属性、光照条件、面部几何数据以及纹理等。接着,在不改变面部关键特性的前提下,使用电影动画技术为面部赋予表情。最后,将照片重新渲染成动画三维人物,这一过程所用到的技术正是二位创始人的老本行——视频游戏中的核心技术之一。


除了趣味性,Mug Life 的惊人之处还在于将电影特效、游戏视频行业的技术搬至移动端,而这些技术往往是需要在工作站或者大型服务器上完成的。


因此,在创业项目搜罗网站(也是新应用风向标)Product Hunt 上,有网友评论道:「估计这家公司马上就要被收购了。」

另有网友调侃道:「这个 APP 一切都很好,就是 UI 设计太差。」并表示如果需要人手的话自己愿意加入。不知道 Coles 看到这则评论会怎么想。


]]> 原文: http://ift.tt/2j63h4b
RSS Feed

机器知心

IFTTT

JDD-2017京东金融全球数据探索者大赛正式启动



设立千亿投资基金首届京东金融JDD大赛吸引全球数据AI人才。四大赛题,中美赛区,明星导师,豪华评委京东金融JDD大赛报名开启,最高30万元!京东金融JDD大赛创造国内人工智能大赛单项奖金纪录。

 

11月6日,由京东金融与红杉资本联合主办的首届"JDD-2017京东金融全球数据探索者大会"正式在北京拉开大幕。在大会举办当天,京东金融副总裁,技术研发部总经理曹鹏与大赛导师共同宣布,首届"JDD-2017京东金融全球数据探索者大赛"正式启动。


近年来,金融行业已经成为大数据与人工智能落地应用的重要行业领域在此背景下,本届大赛在开赛之前就引起了行业内外人士的高度关注 - 这场人工智能全球大赛将在中美两地同步举行,大赛设置了极具创新性的四大赛题,包括登录行为识别,店铺销量预测,信贷需求预测和猪脸识别,每道赛题均设有算法组和商业组,既关注技术能力,又产生商业价值。让数据实现比你更懂你的极致价值,让金融更简单,更平等。


本届大赛旨在更好地连接金融机构与科技公司,并挖掘全球顶级人工智能高手,帮助整个行业提高效率,降低成本,增加收入。优胜团队不仅可以获得创下国内人工智能大赛单项奖金新纪录的30万元赛题冠军大奖,还可受邀加盟京东金融,让自己的数据和AI能力得到更好的发挥。主办方更设立了千亿投资基金对接获胜团队。即日起,所有赛组和赛区均可通过"JDD-2017京东金融全球数据探索者大赛"的官方网站进行报名。


大赛主办方京东金融还特邀包括国际人工智能联合会主席杨强,红杉资本中国基金专家合伙人车品觉,微软亚洲研究院城市计算领域负责人郑宇,TalkingData创始人兼CEO崔晓波在内的四位业界大咖担任商业组中国赛区的导师,为选手提供48小时贴身辅导。大赛的评审团更是由京东金融CEO陈生强亲自挂帅,拥有国际顶级投资人,人工智能专家和金融行业大咖组成的豪华阵容。


谈起举办"JDD大赛"的初心,京东金融总裁陈生强表示,金融和数据天生就连接在一起,人工智能加快普惠金融的到来。数据和场景是人工智能的前提,京东金融在数据和场景方面有着自己得天独厚的优势,我们愿意以开放的心态把数据和场景连接起来并提供给大家。所以我们举办了这场大赛,也是希望优秀的技术团队和公司能够被更多人看到,能够得到社会更多资源的支持,走的更远。


大赛导师杨强指出,京东金融举办的JDD大赛,将场景,数据和技术进行了有机结合,这将会是今后AI发展的一个重要方向。另一位导师,微软亚洲研究院城市计算领域负责人郑宇则表示,这次JDD大赛为科研院所和学生们,以及众多创业者提供了一个很好的试水机会,让他们能够将研究成果在真实场景中得以实践。此外,本次JDD大赛让国内外选手能够同台竞技,在增强交流和分享经验的同时,也让世界真正见识到中国人工智能和数据人才的实力。


领沨资本创始合伙人马宁作为大赛评委,则从产业发展的视角对大赛给予了高度评价,他表示,作为中国金融科技的排头兵之一,京东金融以开放的态度来组织本次JDD大赛,将会积极的促进人工智能和大数据在金融领域的应用,更好地促进中国金融科技产业的发展。


实际上,人工智能,大数据,云计算等先进科技目前正在全球范围被深度挖掘,但这些研究更多存在于理论层面,很难应用于实际场景中。而京东金融举办此次JDD大赛的目的,就是将场景,数据,人工智能进行深度结合,并发扬京东金融的开放态度,让参赛的研究机构,院士学者,资深分析师等不同领域的专家使用京东金融提供的真实数据和场景,探索人工智能的无限可能性,实现各方的合作互生,最终推动全球智能金融的发展。

 

报名参赛地址:http://jddjr.jd.com/

 


]]> 原文: http://ift.tt/2AlFrp4
RSS Feed

机器知心

IFTTT

NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR


上周我们发布了《攻略 | 虽然票早已被抢光,你可以从机器之心关注 NIPS 2017》,在 NIPS 2017 正式开始前,我们将选出数篇优质论文,邀请论文作者来做线上分享,聊聊理论、技术和研究方法。

所以,第一期分享来了。


北京时间 11 月 8 日 20:00 至 21:00,多伦多大学在读三年级博士生 Yuhuai Wu(吴宇怀)将为大家分享一篇 NIPS 2017 论文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。



分享者简介


Yuhuai Wu(吴宇怀),多伦多大学在读三年级博士生,师从 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指导下做研究。主要研究方向是优化算法、强化学习。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做实习,开源了 ACKTR 算法。



演讲主题


这次演讲主要研讨一个最近研发的似自然梯度的优化算法 -- KFAC(似二阶算法)。我们将其用在强化学习的问题上,并提出了新的强化学习算法 -- ACKTR,发现比前人的算法有效 2-3 倍。


针对这篇论文,机器之心曾发布过一篇简介:《OpenAI 开源算法 ACKTR 与 A2C:把可扩展的自然梯度应用到强化学习》,请大家做课前预习。


参与方式


线上分享将在「NIPS 2017 机器之心官方学霸群」中进行。加群方式:长按扫描下方二维码,添加「机器之心小助手Ⅱ」,备注暗号:147,由小助手拉大家入群。




机器之心 NIPS 2017 专题策划:http://ift.tt/2AlxsIx


]]> 原文: http://ift.tt/2j39mOJ
RSS Feed

机器知心

IFTTT

旷视科技成立学术委员会,姚期智担任首席顾问

旷视科技成立学术委员会,姚期智担任首席顾问,并解答人才、跨学科研究、论文等问题。


作者:藤子


11月5日,旷视科技联合清华大学、清华交叉信息学院以"人工智能的本质创新"为主题在清华大学举办了一场研讨会,在会上,旷视科技宣布旷视研究院成立学术委员会,邀请姚期智先生担任其首席顾问。


姚期智是中国科学院院士,首位图灵奖华人获得者。作为现代密码学、理论计算机科学、量子计算等领域的奠基人,姚期智创办的"姚班"培养出了大批计算机科学领域的人才,旷视科技的三位创始人——印奇、唐文斌、杨沫就正是"姚班"的学生,而在旷视科技内部,也有相当数量的员工来自于"姚班"。


据旷视科技首席科学家孙剑表示,学术委员会主要的功能,在于为公司提供一些无论是学术角度还是工业角度,都超出当前事业的见解。


印奇表示,为什么选择在现在成立学术委员会,是因为在公司技术创新过程中,以及将技术应用到业务的过程中,看到了一些更本质的问题,需要借助更好的理论框架去解决。而旷视科技作为行业的领军企业,有责任解决更本质的问题,做本质创新。


"我们创业初期的时候,很难有机会谈未来三年五年十年,随着现在的发展,思考眼前一年半年以外,也要思考未来如何,当我们在有一定实力的情况下,我们要在正确的方向上,给予大力的投入,这也是成立学术委员会的原因。"杨沐补充道。


在这个活动上,姚期智和印奇、杨沫、唐文斌以及孙剑一同探讨了人工的本质创新以及人工智能未来的发展,旷视科技的三位创始人分享了旷视未来的三年计划、融资观点等,而姚期智也从自己的角度分享了他对人工智能领域人才、论文、PhD等的看法。


一,旷视未来三年的计划


印奇:未来三年,最重要的事情是什么,我们内部有两句话——"赋能机器之眼,构建城市大脑",这是未来三年要做的事情。


赋能机器之眼,安防是未来城市和物联网的雏形,现在安防行业以政府型的项目为主,以硬件为主要的产品,未来一定是偏网络化、中心化的解决方案,是真正多层级的系统。在这其中,我们定位很简单,就是"赋能机器之眼",我们非常强调软硬结合,未来互联网终端设备越来越丰富,我们希望成为未来的技术核心,技术核心不是SDK这种,而是云和端的结合。其中,赋能的本质是如何能够打通数据链路,而非单独的封闭的闭环,这是我们在这个产业中对自己的定位,希望我们是赋能者。


构建城市大脑,我们最核心的定位是,把数据连通,智能化形成平台化的计算范式,构建大的趋势,把安防、金融、零售甚至智能物流、金融、制造结合在一起。


唐文斌:"赋能城市之眼,构建城市大脑",具体来说,第一,我们作为赋能者,广泛地跟厂商合作。第二,由于现在技术成熟是分周期的,不是一上来就很完美,所以技术与产品怎么结合,技术与场景怎么结合,技术与最后解决方案怎么结合,客户的价值怎么体现,需要结合场景、技术和算法的边界,权衡各类问题之后,提供综合方案,我们自身也会作为整体的方案提供商,帮助构建城市大脑的逻辑。


二,关于C轮4.6亿美元的融资


印奇:某种程度上来说,我们不需要那么多钱,但为什么要融?第一,某种情况下,这能证明旷视在这行业的领导地位。第二,希望我们有这样的实力,树立一个正确的评价标准。


人工智能行业和O2O不太一样,希望大家不仅要关注融资,还要关注钱用在哪了,这个行业是不是有更本质的创新和发展。人工智能行业目前还不是烧钱的阶段,现在有一个不好的现象是,大部分人工智能企业融的钱并没有很好的价值传导,唯一效果是让人才的价格水涨船高。我们为什么要选择这轮融资,是因为我们选择了大的产业方向,金融安全、城市大脑、手机智能,三个方向都有上下游整合的趋势,我们希望更多地把行业做深,融的钱在行业落地。人工智能行业是技术驱动,产业驱动,而不是完全资本驱动,我们希望把融来的钱用得其所,这是我们的融资观。所以希望不要以融资额评判公司的好坏,而是要关注这些公司究竟有没有给行业带来价值,产品的落地如何,从大的舆论环境树立更好的标准。中国人工智能行业有机会比美国做得更好,我们不要错失这样的机会,也需要更好的大环境,也是我们一直强调的。


唐文斌:我觉得融资的核心目标是做扎实,虽然我们的团队可以靠自己养活,但是细化来看,很多东西没有做扎实,从技术到产品到本质创新,到业务的落地,到交付给用户的价值,之前顶多是85分的状态,我们希望做到99分、100分。 


三,关于旷视的本质创新


孙剑:人工智能有理论的创新,工程创新,算法创新。我从算法的角度来看,算法的核心是解决一个特定的问题,算法上最本质的创新,在于对需要解决的问题的深刻理解,新的视角,新的观点,这是第一个层次。


第二个层次,在一个特定时期认定了一个问题,求解这个问题的算法,我看重两方面,它是不是具有通用性,比如说我们做万物识别,两万种物体,我们并不希望一种算法,只能识别猫或者狗,通用性越强,算法影响力越大。另外,别人是不是可以重复使用这个算法,我们不希望论文发表了,没人关心,没人关心说明没有解决问题的痛点,没有触及到问题的本质。那么,我们希望在算法上创新之后,让其他同行从业者、产业界的人看到算法,主动去应用算法,在算法研究中解决问题。这就说明这个算法做到本质创新,解决了痛点,触及了问题的本质。


唐文斌:我们把不太本质的创新,用另外一种方式,相对本质的解决。我们在深度学习框架内,突破了现在的框架,突破了深度学习现在的边界,另外我们尝试各种模型,哪个数据更好用,通过这样的组合,我们基于人脑的搜索,搜索出来哪个东西解决了这个问题,我跟杨沐在公司里做的工作就是,能够流程化、工程化,通过一套系统把边界内搜索的工作,真正变成一个系统,这个系统能够自动尝试各种模型的类型,去做模型的搜索,把这个东西变成一套系统,不本质的创新,用本质的方法解决了他,这是我们现在做的一些工作。


印奇:我们在产业界的创新,举一个例子,在金融领域,有非常好的市场和产品,服务很多客户。做人脸识别三四年之后,在这个行业里面另外一项技术,就是如何验证这是一张真人的脸,而不是一张照片或者视频。这样的创新对行业来说是非常本质的,而为什么能有这样本质的创新,是因为我们深扎到行业和场景,发现了这些问题,和最优秀的科学家解决了问题。第二,我在微软研究院,开始做人脸识别,到今天快十年了,当你在不同的数据量的情况下,你解决问题的方法从不本质到本质,而工业界、产业界给你一个最真实的问题,从最正确的方向上解决问题,屏蔽掉一些并不本质的创新或者甚至质量较低的创新,企业界跟理论界有更好的结合,会互相促进,使得创新做得更好。


四,关于人才


姚期智:人工智能领域的人才,最重要的特质就是聪明,这可能比其他学科更为明显。由于机器学习的发展,对很多人来说,有一个好处,如果用人工智能解决问题,很多以前要学的东西都可以不学。如果你是一个本科的学生,努力学习了一两个学期,如果你够聪明的话,就有可能马上脱胎换骨对尖端的问题也能做出贡献,所以聪明是一个很大的优势。当你了解这些已经知道的算法之后,下一步就是必须要有足够的在工业界的实战的经验。比如你在武当派练内功以后,剑法学得很好,但没有实战经验,出去碰到高手可能一下子就被解决了,所以实战经验非常重要。在一些人工智能公司,会有一些新的问题,对于聪明的好强的有野心的人,这是非常好的事情,因为可以激励他解决问题的决心。解决问题,对这个领域就有贡献,对人类社会就有贡献。


五,如何看待PhD


姚期智:这要根据个人的兴趣,和将来工作的方向来定。因为不同的人在这个领域想做的事情不同,觉得最有意义的事情也不一样。要让每一个人决定他最想做的,最有意义的事情是什么,才能真正发挥他的聪明才智。


那么PhD有一个好处,相当于它强迫你要晚一点成熟,比如,你的武当派老师傅说,你现在出师可以行走江湖,如果你多学十年再出师,学到的内涵更多,将来成就跟大。PhD过程中的一个好处就是,理念比较规范,更有可能在本质上深入地解决问题。如果你出师得早,一开始就完全来解决问题,那么你可能会觉得解决问题的魅力非常大,就会想一个一个自己来解决问题,就不大可能思考什么是人工智能的本质,这些问题你可能就没有解决。


六,如何看待论文


姚期智:我觉得发表论文,也有一些道理。论文是一个相对客观的衡量标准,使一般的机构或大学能够有一种方法,能够成为一个大家觉得比较公正的平台。另外,对于做研究而非做产品的人来说,做出来的工作,能够变成论文,接触到杂志或者会议,对他精神上能起到鼓励的作用,表明他做的事情,至少还有人认可。


但从实际的角度来说,这并不是最好的理由。比如在实际的工作中,你有方法能够判断这个人才如何,判断他做的工作如何,这个工作或许两三年能做出新的产品,或许三五年才会领悟出新的结果。但对于大多数研究院或研究机构,除非最优秀的地方,基本上没有能力判断,所以需要一个替他把关的标准,论文是一个没有办法的办法。


二十年前,靠杂志和会议来评判研究机构的研究人员做得好不好,那时需要从很低的水平,达到现在一般的水平,在当年是无可厚非的,现在还需要有名声的杂志来判断,主要是还没完成这个转变。大家也在看如何才能有更好的方法做评判。我们不能完全相信论文数量,但是它的存在还有一定的意义。


七,如何进行跨学科的研究


姚期智:如果要进行跨学科的研究,你要对好几个学科都有相当的认识,我认为最重要的就是数学和计算机科学。但是,我们对如何训练跨学科人才,并没有那么了解,所以还是要依赖年轻的同学们自己的经验与体会。跨学科探索,不是每个人都应该做的,有很多人做这个事情,反而不能达到本来可以做的事情。有一些人,他喜欢这种高挑战性、冒险性的,可以寻找同伴跟同伴一起,深入思考要探索的问题,逐渐发现自己的不足,去摸索。


孙剑:跨学科研究,我们自己看是从上往下,看到几个方向,但是我在旷视科技看到了从下往上,我们接触产业,接触产业中的实际需求,看到了跨学科的需求,比如计算机视觉,我们接触到了工业制造、智能制造的很多需求,比如做机器人,这里面不光是感知的事情,还有交互,里面有大量的小的问题,有非常强的需求,把不同的东西连接一起,能解决重大影响性的问题,我们公司还有很多姚班的同学,姚老师培养的有跨学科潜质的同学,放在一起可以产生好的环境,也可以产生跨学科的研究工作。


八,人工智能的路径


姚班同学:关于人工智能的路径,以前为了解决飞翔的问题,人类和生物界用了不一样的方法,至今人类也造不出鸟儿翅膀那样精巧的结构,造了一个压气机,效率不怎么高,但是也能往上飞,大规模使用。那么。人工智能将来是一种什么样的途径?


姚期智:这个问题很大也很好。人类科技的发展,确实到了能让我们想得更大的时候。开始一两万年,人类都是懵懵懂懂的,最近一两百年,好像突然厉害起来。所以现在到了一个程度,我们来想想看,我们能不能和老天竞争。


世界很美丽,也非常了不起,这个世界里面最壮观的到底是什么,自然界给我们什么东西?我觉得有两样。


第一,自然界本身的精妙程度完全超乎我们想象,比如,宇宙中有黑洞,天空中有鸟在飞,身体里面的DNA,看起来有人设计了自然界。那我们能不能用相应的方法,用人造去做。人类想要模仿自然界,这是最后的一个关口,我们一旦做好量子计算机,就能够模仿宇宙的各种东西的运转,包括设计材料,我们可以把量子计算,看作是我们跟老天竞争的第一个事情。


第二,最近十几年的发展,让我们至少部分做理论研究的人认识到,我们要有新的方法来做,我们要有跨学科的精神,如果计算机科学不能在研究方法和解决问题的方式上,打开我们的心胸,建设一些适合解决问题的理论的话,我觉得我们会被淘汰,如果很多问题我们不解决的话,会有别的学科用他们的方法来解决这些计算的问题。


]]> 原文: http://ift.tt/2j5haj5
RSS Feed

机器知心

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...