2017年9月30日星期六

120位博士,每天签下1单,这是商汤做「AI生意」的底气

撰文 | 王艺


今年 8 月底,苏宁在南京开出全国首家真实投入运营的无人店——苏宁体育 Biu。在这家面积约 40 平米的体育服饰和产品商店里,陈列了 90-100 种商品。当消费者在苏宁金融 APP 绑定人脸信息 ,进店时只需要抬头刷脸,挑选好心仪的商品后,在付款闸门前停留一下即可离开,在这几秒钟时间,系统会自动识别顾客信息及商品信息并扣费。


对苏宁而言,这套系统可以让线下门店也像电商平台那样获得数据实现精准化营销。配套安装在店内的两个摄像头能把顾客挑选商品的行为捕捉记录下来,比如顾客是男是女、年龄范围、行走路径、在哪里停留、挑选了什么商品等信息,由此可以辅助判断某位顾客的消费偏好。


这背后需要大量 CV 技术的支撑,还包括商品信息识别融合使用 RFID(射频识别)技术,并部分辅以 CV 技术。这家无人店不仅仅是苏宁智慧零售的第一个尝试,同样也是背后技术提供方商汤科技(下简称「商汤」)探索 AI 技术链接零售行业的第一步。


商汤科技联合创始人、CEO徐立博士


成立于 2014 年的商汤,是今年 7 月人工智能领域天价融资的主角 (获投 4.1 亿美元 B 轮融资)。


仅用了 3 年,商汤团队就从 30 人扩张到 700 人,其中有120 位拥有博士头衔。另外值得一提的是,商汤也是国内高质量专利最多、专业学术论文发表数量最多的人工智能企业。特别是在 2015~2017 年,商汤在 CVPR、ICCV 和 ECCV 全球三大计算机视觉顶级会议上与香港中大-商汤科技联合实验室共同发表的论文共超过 70 篇。


从商业角度来看,商汤把自己的业务模式称作 1+1+X:


两个 1 分别表示学术研发及产业结合,X 则代表技术赋能。正如公式所表述的,商汤希望通过与各垂直场景下的产业结合,将 CV 技术下沉到人们的日常生活。


然而,技术向商业场景的转化并不如说的那么容易。


直到 2015 年 9 月,商汤才迎来公司成立后的第一波机会——开始与一些银行以及 P2P 公司接洽,并逐步签下几个千万级别的合同。实际上,在没接到单子之前,商汤一直在不停地拿需求、做产品,然后发现产品根本无法满足需求,就继续对产品进行更新迭代……以此循环往复。


三年后的今天,商汤发展客户的速度,已经变成每个工作日签下一单。基于 CV 技术的 产品数量也从单一品类扩展为10 余款从不同垂直场景切入的产品:


从一开始做的为智能手机提供人脸识别、人脸解锁、美颜功能等技术支持,再到为安防及监控领域提供人车识别、安防布控、身份核验等技术方案,亦或者是为人脸识别闸机、身份验证一体机、以及智能广告机等智能终端设备提供成套解决方案,商汤的技术商用道路已经拓展到了一定的宽度。


徐立将商汤的技术方案比做乐高积木,它们既可以任意累加,又可以单独使用,也允许别人继续在上面搭其他积木。而现在,商汤想做的事情是进一步下沉到各个传统行业中去,针对他们的业务需求提供不同的解决方案,让他们将商汤的底层模块运用到极致。


CV 落地新零售,「你是谁」才是要解决的问题


目前,市面上的无人店主要有几类:自助化售货模式、进店及结账等消费环节智能化模式、消费和购买行为全面智能化追踪的模式。


虽然这些模式智能化的程度不同,但它们在店面大小、客容量、可售买的商品类别方面都受到限制。实际上,无人店的终极形态应该是这样一番场景:顾客通过语音及姿势与商店及货物进行无障碍交互,且整个店面的大小与客流数将不再受限。


而开头提到的苏宁无人体育商店 Biu,其运用的 CV 技术就来自商汤的 SenseGo 智慧商业解决方案。


据商汤科技联合创始人、副总裁杨帆介绍,应用在无人商店垂直场景中的人脸识别技术,必须做到「快」、「准」、「稳」。而在商汤的这套解决方案中,从消费者入店识别到走入闸门,通过扫描人脸完成身份确认的时间不超过 0.5 秒。与此同时,这套系统也能完全应对无人商店内部的复杂结构与个人行为差异。


另外,对零售商来说,技术改造的门槛低才具备可复制性的条件。商汤告诉机器之能,在与苏宁的合作中,苏宁体育 Biu 的系统研发耗时不到 8 个月,门店搭建及装饰在一天之内即可完成。因此,苏宁还计划在北京、上海、成都等地陆续「苏宁超市 Biu 」、「苏宁极物 Biu 」等其他主题无人店。


事实上,除了苏宁体育 Biu 场景中所涉及到的 CV 应用外,商汤还把技术用在了实体店内的导购环节。举个例子,通过智能显示屏,门店可以对来回走动的客户进行因人而异的商品推荐,实现精准下单。


总而言之,依靠技术,传统零售也能像互联网电商平台一样与顾客进行个性化交互,并同时获得宝贵的优质数据资源,譬如消费者群体分布、活动轨迹、到访记录、消费行为及喜好等诸多详细信息。商汤认为,在客单价较高但服务成本同样很高的销售场景中,如售楼处、汽车 4S 店等地,对进店顾客行为进行「跟踪」能够促成更多商业价值的转化。



商汤科技 SenseGo智慧商业解决方案


譬如,进出售楼处两次以上的客人,很有可能抱着相对更大的购房意愿。因此,智能化门店可以通过数据分析将其设为 VIP,提供更精准的服务,比如为他们开启短信提醒服务,进行更精准的定向推送。这在某种程度上,对销售提高业务量有很大的帮助。


「现在很多商店都有各种各样的问题,譬如东西应该怎么摆,才能更有效,才能更好吸引客流。」徐立说出了传统实体商店的困惑,「实际上,店家的很多数据都没用上。这些数据都可以经过精确计算给他们一个好的答案,从而制定出更精准的营销策略。」


从合作方苏宁的角度来看,作为国内零售行业巨头,他拥有线下丰富的销售入口,有能力为商汤的 CV 技术提供了落地场景。徐立很确定,这种应用就是其一直强调的 1+1+X 业务模式。其中,第二个 1 所代表的,就是与苏宁这类传统零售产业的结构化融合。


不过,徐立也毫不避讳揭开 CV 技术的落地难点:


「手机支付以及银行信息核对等场景是 1:1 的比对,需要解决的问题是『你是你』,是简单的对比分析,相对容易。与之相比,在新零售领域需要解决的问题是『你是谁』。这个问题更为复杂,因为其决定性因素在于商家的信息池有多大。


譬如,一家美容院有一千位顾客,那么当一位顾客进店时,系统需要在一千份人脸信息中进行查找。假设这样一种极端情况——如果该商家的客户池是全世界的人口,由于池中信息太多,以现在的技术水平来看,准确率还不能尽如人意。」


让 CV 技术紧贴各行各业


除了新零售,商汤其他涉及到 CV 应用的解决方案也找到了属于自己的「落脚点」,其每一款产品都非常有针对性地对应一个功能。


譬如,在 CV 最初的应用场景——安防领域,这项技术可以有效地在火车站、机场等人流密集地带,对监控探头拍摄到的画面进行实时分析,也能通过人群流动情况来有效预警踩踏事件。


当然,商汤在安防领域取得的成绩很有效地证明这一应用:曾在 40 天内,为重庆某个区识别出 69 名嫌犯。此外,仅在 2017年上半年,商汤就为广州省当地公安机关成功破获了 200 多起案件。


除了对人进行识别外,汽车与非机动车的图像识别也是商汤的业务重点。


徐立称,在商汤的这类 CV 产品中,汽车有 4000 多种车型标记,而道路上的行人也被标注了 40 种属性。原因就在于,对这些特征进行识别、描述、结构化梳理,能够降低监控视频的存储空间。


「在未来,监控视频的存储方式为一个个结构化条目,这些条目能够很好地被恢复成人、车、非机动车的轨迹,通过自然语言进行管理。」



商汤科技SenseVideo视频结构化服务器


此外,城市服务也被徐立视为长期的商业场景落地目标。


「商汤用了 2 年时间,帮中国移动的用户完成了三亿用户的实名认证。」他说,「目前,业内对智慧城市的认知还处在较为模糊的状态,但从工业城市到智慧城市的发展是必然趋势,这其中的关键在于城市服务水平的提升,而 CV 技术能够起到很大的作用。」


人们日常生活中最离不开的手机也同样是 CV 技术最为直接的应用。


近几年来,许多自拍 APP,以及新浪微博、抖音等社交平台纷纷为自己的拍照功能及短视频添加各种夸张特效,以此吸引到了大批用户。其中,最有代表性也是首批推出人脸特效的 Faceu(脸萌), 便采用了商汤 CV 技术。



商汤科技SenseAR增强现实绘制平台


此外,CV 技术也能让手机用户更轻松地查找照片,通过人脸识别、物体识别对图像进行索引,能够触发很多附加价值。例如,在手机中的照片被重新培训标注后,新生儿妈妈们就能在手机上设置「每天自动更换宝宝照片作为屏保」。另外,双摄像头手机优秀的拍照效果也得益于 CV 技术,通过图像处理,手机拍照能够与单反相机一样具备景深及背景虚化功能。


当然,苹果本月推出的具备「刷脸功能」 的 iPhone X ,也将 CV 技术推向风口浪尖。而国内手机厂商,如华为、小米等等,此前也纷纷加入了刷脸大军。而徐立分析,在全屏时代到来,指纹识别模块无处安放的情况下,刷脸解锁将成为未来一段时间内的主流。根据他的透露,目前商汤正在与多家主流手机厂商合作,为他们提供刷脸解锁与支付相关的 CV 技术。


那么,安全问题如何解决?


徐立认为,由于人脸的特征维度颇为丰富,因此相较于指纹解锁,其解锁准确率更高。实际上,人脸解锁技术在一年前就已经达到能够商用的程度,而且当时的解决方案中就已经包含活体检测技术。


「经过一年多的测试与打磨,刷脸技术其实能够达到相应的安全性需求。此外,个人手机与无处不在的摄像头不仅不会威胁到个人隐私,反而会对其加以保护。人脸识别技术能够将你的人脸信息转化成一串不可逆的代码,不再被以影像的形式存储。」


当然,新技术的出现总是会受到质疑。徐立提到一个现象——商汤在早期做互联网金融领域的解锁应用时,每天 100 万次的调用中,有 20 万次是「攻击行为」。即使是苹果推出刷脸解锁功能后,受到的攻击也比传统密码时代高 60 倍。


「这是历史发展的必然,指纹支付出现时也遭到了这样的攻击,但刷脸技术一定会经得起时间的考验。」


CV 技术为带来的商业与社会变革还不止于此。徐立认为,视频方面 CV 技术的突破将对整个搜索及电商营销模式带来彻底的变革。如果视频识别与理解技术最终达标,那么其不仅可以连接电商、社交游戏,还能够改变搜索业,成为新的交互入口。


徐立预计:「五年之后,手机中的 APP,要么转型,要么被颠覆。」


目前,商汤称自己掌握着短视频和直播行业的标杆性解决方案,为直播平台提供智能化的特效、脸部关键点定位等技术。特别是在关键点定位方面,学术界曾经使用眼睛、鼻子、嘴角等 5 点定位技术,并逐渐发展为至 21 个点。而早在两年前,商汤就率先提出 106 点的定位,并成为业内通用标准。


今年 8 月,商汤进一步提出了 240 点定位,解决了以往技术方案中诸多不能很好完成的问题,譬如「撇嘴」、「睁一只眼闭一只眼」等丰富复杂的人脸表情都可以被精准地识别,同时也能够满足这项应用在主流手机上实时运行的需求。


技术的底气


徐立认为,这一波人工智能的兴起,对于普罗大众而言,虽然像是一夜之间火起来,但实际上,真正的驱动力是核心的引擎和算法,深度学习颠覆传统算法模式之后,才带来了这一波能力的突破。


「在这个过程中,你要真正掌握核心能力,需要有 5-7 年的积累。」


在徐立看来,核心能力的积累过程中,最重要一环是招揽足够优秀的人才。人才代表了企业的核心实力,高质量的团队能够帮助公司在一定程度上垄断市场。徐立以当初谷歌豪掷 4 亿英镑收购 DeepMind 为例,认为谷歌收购的其实是 DeepMind 背后的 12 位博士,这些人成就了 AlphaGo。


徐立认为,一名 AI 人才的成熟也需要 5-7 年的积累 。他希望公司能够尽可能多地「收集」市场上已经成熟的 AI 人才。他还提到,公司将大约一半的资金投入到人才招聘方面,已经有了一支 120 人组成的博士队伍。


「我们当时融资只融了 2 千万美金,最后发现人工智能这本账其实是人才的账。你把真的能做『大脑』设计、底层算法研究的人才市场垄断了,那么行业再培养一批人就还需要 5 年时间。在这段时间里,你就有足够的时间窗口做到行业领先。」徐立说。


但技术人才的储备与管理也有明显的挑战。由于目前 AI 行业技术人才大多从学术界引入,与业界需要面对复杂的用户需求不同,学术界擅长把问题限定在某个明确条件下去解决。因此,学术与应用层之间的「鸿沟」是需要被弥补的。


为了弥补这一断层,商汤建立起了自己的人才造血机制,以优秀的员工为导师,从零开始培养人才。徐立谈到,商汤有很多刚毕业的学生,放弃读博直接来到商汤做研究,因为他们认为做实际应用的产品远比在学校中的研究更有趣。


另一个商汤招揽足够多人才的目的,是要打造自主研发的底层深度学习技术平台。虽然在当下的创业大环境中,花大力气去研发底层平台是大多数创业公司所避之不及的。但徐立认为,中国的科技公司不能像当年做操作系统的时候一样,有 Linux 就直接在 Linux 基础上打造产品,导致国内这么多年也没有可以媲美 Linux 的操作系统诞生。


同样,在 AI 领域,虽然使用谷歌、Facebook、亚马逊的开源技术是站在巨人肩膀上,可以做到事半功倍。但长远来看,有自己的底层技术才能具备占领市场的底气。


商汤想要让技术取得进步,累积足够多的数据,推动 AI 产业应用落地,最终形成正向的反馈闭环,相互促进。


]]> 原文: http://ift.tt/2fEejw4
RSS Feed

机器知心

IFTTT

苹果低调收购计算机视觉初创公司Regaind

编译 | 张震

来源 | TechCrunch


TechCrunch 通过多种渠道了解到,苹果已收购一家法国小型初创公司 Regaind 。和往常一样,苹果的这次收购相当低调,当 TechCrunch 与苹果取得联系后,也只得到了如下的回复:「苹果会不定期的收购一些小的科技公司,我们一般不谈论我们的目的或计划。」


这是苹果一贯作风,也客观上证实了这一收购。据 TechCrunch 称,苹果对 Regaind 的收购是发生在年初,这家一直致力于通过计算机视觉 API 分析照片内容的公司,曾从 Side Capital 融得近 50 万美元(40万英镑)。


而苹果几年前也已将智能搜索应用到手机 App Photos 中,苹果会在用户睡觉时,分析用户的照片库。当你将 iPhone 连上充电器,不使用手机时,设备会运行计算、识别手机中的照片。


Regaind 在这方面走得更远一些,它可以告诉你照片拍摄的技术水平和美学价值。打个比方,如果你在连拍模式下,拍了一组照片,Regaind 可以自动找出效果最好的一张,存储在照片库中。此外,Regaind 还可以将复制的照片隐藏。


收购完成后,苹果可以利用这一技术完善 Photos app 的 Memories 功能,iOS 可以依据事件、地点和其它要素自动创建相册。借助于 Regaind 的技术,iOS 可以查找类似的照片,将拍摄效果最好的照片设为封面,或是生成一个回顾视频。


更为有趣地是,Regaind 也可以通过分析人的面部确定人的性别、年龄和情绪。无从判断,苹果是否有足够时间将 Regaind 的技术融合到 iOS 11,或将 Regaind 的模式直接应用到苹果的设备中 。


不过,苹果可能会将该公司的技术与新型  Face ID 传感器相结合,应用到iPhone X,提高 animoji 面部表现。可以肯定的是,还有许多值得期待的成果将会呈现。另外,苹果一直在强调隐私问题,苹果在引入Regaind 的技术后如何保证用户的隐私,也是一件相当令人感兴趣的事情。


]]> 原文: http://ift.tt/2x54PRU
RSS Feed

机器知心

IFTTT

用代码描绘出分子世界的壮阔星空,化学家和程序员开启新的征程

编译 | 王艺 高静宜 不定项

来源 | Nature


2016 年,制药公司 Sunovion 分配给经验丰富的员工们一个不寻常的任务。


在马萨诸塞州马尔堡的总部,化学专家们被要求玩一个游戏,看谁能先找到制造新药物的最佳线索。他们面前的工作站上有数百个化学结构网络,其中只有十个被标记了相关的生物效应信息。专家们不得不借助他们在化学和生物方面积累的知识,来对分子进行抉择和判断,进而找到可能成为新药物的候选者。在 11 名参与者中,有 10 位花费几个小时的时间来完成这项工作。而另一位则在几秒内轻松通过了这个考验——用算法来解决。

 

这个计算机程序是 Willem van Hoorn 的一个点子,他是创业公司 Exscientia 的首席化学信息专家。这家公司位于英国邓迪,尝试利用人工智能来设计药物。Exscientia 希望能够 Sunovion 构建合作伙伴关系,因此在这一课题上下了很大的赌注。「我很值得信赖。」van Hoorn 说道。20 轮游戏过后,他总结出了规律,终于放松了下来。他的算法精通一些化学黑魔法,在寻找新药物的过程中,只败给过一位专家。

 

从那开始,Excientia 和 Sunovion 就携手展开精神科药物的研发。「那场比赛非常有助从那些化学研究决策的人手中获得经验。」Sunovion 公司的计算化学部门主管 Scott Brown 说道。

 

在工业和学术领域,越来越多的团队把目光瞄向了计算机,希望借助计算机技术探索这个极其广阔的化学世界,Exscientia 只是这其中的一员。化学家估测,约有 1060 种具有类药物特性的复合物是可以合成的,这些分子比太阳系中原子还要小很多。

值得庆幸的是,合适的计算机算法可以对海量复合物的特性进行分类、识别以及比对,帮助研究人员快速高效、经济实惠地根据目标找到最佳候选药物。支持者认为,这些策略可以提升药物的安全性,降低药物在临床试验中失败的几率。不仅有助于新型治疗方法的发现,还能拓展人们在化学领域的研发空间,开辟之前未被开发或是被认为贫瘠的研究领域。

 

然而,也有许多药物化学专家怀疑这是一场炒作,他们并不相信具有不可言喻的复杂度的化学问题可以仅被一行代码解决。即便是那些认可 AI 的人们在尝试中也经历过失败:计算机合成的复合物可能充斥着很难真实用于药物合成的组成成分,例如 3-或 4-原子环,或是有活性基因会引发安全警报。「当研究人员不了解这个领域时,这些计算机方法的实现可能会遭受一些非议。」van Hoorn 说道,「他们想出的那些复合物令人感到可笑。」不过他也表示,人类专家的确可以对这些数码设计师起到调和作用。「我认为,如果计算机科学家能和浸淫在化学领域的人合作,那么之前的一些想法就能够真正发挥出作用。」

 

分子世界的壮阔星图

 

为了在化学世界航行,一张地图是非常有帮助的。2001 年,瑞士伯尔尼大学的化学家 Jean-Louis Reymond 开始使用计算机绘制尽可能多的空间可能性。16 年过去了,他积累了世界上最大的小分子数据库,这是一个巨大的虚拟 1660 亿个化合物的集合。这个名为 GDB-17 的数据库包含了所有由 17 个原子组成的有机分子——这也是 Reymond 的电脑所能处理的数据。「让一台电脑编辑一份化合物的清单,可能需要超过 10 个小时。」Reymond 说。

 

为了理解这些药物合成的众多可能性,Reymond 已经想出了一种方法来组织他的化学宇宙。他从元素周期表中获得的灵感后,计划将化合物按照相关属性组合在一个多维空间中。这些元素的位置按照 42 个特征来分配,例如每个化合物里有多少个碳原子。

 

对于每一种已经上市的药物,都有成千上万种化合物的分子结构与它类似,差别只在于多了氢原子或者是多了一个双键。其中某些的治疗效果可能比目前被批准的药物效果更好。通常而言,化学家们不太可能遍历所有的可能性,就像 Reymond 所说:「你不可能用一支笔和一张纸在获得这些同分异构体。」

 

幸运的是,Reymond 和他的团队可以利用计算机寻找与核定药品结构相似的化合物。通过使用一种特殊的药物作为研究的起点,团队可以在短短 3 分钟内梳理出数据库中所有的的 1660 亿个化合物。在一项理论验证研究中,Reymond 以一种结合尼古丁乙酰胆碱受体的化合物开始,计算机列出了 344 种相关化合物的清单。研究小组合成了三种,其中两种可以有效地激活受体,并对治疗肌肉萎缩有所帮助。这种方法就像使用地质地图寻找掘金点,Reymond 说:「你需要一些方法来选择你要挖掘的地方。」

 

另一种方法是利用计算机提供大量的潜在掘金点,可以避免了不知从何开始的困境。在药物的研究中,这意味着在电脑模拟中筛选大量的化学数据库,寻找与特定蛋白质结合的小分子。首先,研究人员必须利用 X 光决定结合点。接着,利用分子对接算法,电脑可以通过复合集合来找到最适合的结合方式。

 

随着计算能力的爆炸式增长,这些算法的能力也得到了大幅提升。在 2016 年,加州大学的化学家 Brian Shoichet 及他的团队利用这一方法寻找一种新的止痛药,这也表明了这一方法的潜力。该研究小组筛选了超过 300 万种可获取的化合物,有选择性寻找降低呼吸频率的药品。研究人员很快将这个名单中删选出最适合的 23 种化合物,以便后续的研究。


 

利用计算机和数据筛选化合物

 

实际上,Shoichet 还是旧金山一家生物科技公司 Epiodyne 的联合创始人。他们还计划利用这项技术研发更合适的止痛药。他的团队还对浩如烟海的分子结构的进行分析,有些结构从未出现过,但容易通过人工的方式合成。

 

而且,目前已有商业化的药物开发公司在尝试这种方法:位于剑桥的生物技术公司 Nimbus Therapeutics,正在将天然化学物质的特性从自然环境转移到电脑屏幕上。目前还不清楚这些药物是否最终可以合成药物,但该公司的 CEO Don Nicholson 表示,至少已经完成了一种药物的设计方案,「这也是我们未来需要攻克的方向。」

 

这些从屏幕上得到的初步结果正在动摇 Shoichet 关于化学空间的核心假设:只有那些已经存在的,更容易合成药物的领域才值得关注。如今这些模拟出来的分子结构具有良好特征,甚至有些人认为到别处寻找是一种浪费时间的做法。「在我的职业生涯中,我一直相信这点:只要能行得通就行,即使没有太多证据。」Shoichet 说,「我开始认为这些分子构成的星系里充满了黄金。」

 

化学家和程序员的征途

 

这些数据搜寻工作已经被充分地尝试并测验,但结果是计算机只能根据有迹可循的指导线索行事。在药物发现领域,目前最前沿的科技来自机器学习,这种算法能够根据数据以及经验自主学习,逐步达到预计的学习效果,并能发现人眼观察不到的药物结构。目前大约有 12 家公司正在研发机器学习驱动的药物发现算法,并与大型的药物公司进行合作测试。

 

Andrew Hopkins 是 Exscientia 的 CEO,他深知这些新途径的威力所在。平均来说,一种新药从发现,到优化,到临床前研究需要 4.5 年,化学家们经常会合成上千种化合物,来保证最后能够得到足够的制药线索,即便是这样,这些线索能够推向市场的可能性依然微乎其微。Exscientia 尝试将一些算法进行组合(其中一个是前文提到的在 Sunovion 的研究中惊艳众人的算法),这些算法的组合或许能够将药物研发的 4.5 年降低至 1 年,并且能够有效减少前期需要准备的化合物的数量。


 

「人机结合能够打败所有人类,而且能打败所有算法」


 

2015 年,Exscientia 在大日本住友制药举办的一场比赛中鏖战了 12 个月之久。大日本住友制药是 Sunovion 的母公司,总部位于日本大阪。Exscientia 的研究者们训练 AI 工具使其学会寻找两个 G 蛋白偶联受体结合构成的药物分子,发现算法只需合成不到四百个化合物就能找到一个符合要求的选项。Hopkins 表示,这些新出现的药物正在接受精神疾病相关的临床试验。自今年五月以来,这家公司已经与位于巴黎的 Sanofi 公司和位于英国布伦特福德的 GlaxoSmithKline 签署了总价上亿美元的合同。

 

Numerate CTO Brandon Allgood 表示:「除发现药物线索外,机器学习算法还能帮助要富研发人员尽早抛弃无用的化合物。」Numerate 是一家位于加州圣布鲁诺的 AI 药物设计公司。他说,如果该化合物最终会因为有毒或者需要好几个月人体才能吸收的话,那么把它造出来并且进行测试是完全没有意义的,而 AI 系统只需 1 毫秒就能够判断该化合物到底值不值得继续进行。Allgood 在深入化学领域之前曾是一名受过专业训练的宇宙学家。今年,Numerate 已经与制药公司谈成两单合作,其中一单的合作对象是位于法国叙雷讷市的 Servier 公司,在这里,Numerate 对 AI 算法发现的药物进行心力衰竭与心律失常的临床试验。

 

产业投资越来越狂热,但计算方法仍需增强。Reymond 的数据库和其他的药物数据库相比已经非常庞大,但它也还是只覆盖到了药物宇宙中最微小的部分。尽管 Reymond 的数据库中已经有 1.66 兆种化合物,但他离目标的距离仍非常遥远,就好像一个想数清天上所有的星星的天文学家,但却迄今为止只找到了一颗的。


目前,过滤化合物的方式依赖于观察蛋白质与化合物的结合,若要达到好的疗效,需要结合物具有非常精确的晶体结构,其中用到的数据需要大量的时间、金钱、以及科研专家才能获得。同时,这些算法还需要想方设法地避免与运动中的蛋白质「误结合」,而且算法对化合物的推荐程度的排序能力也不尽如人意。在这些问题上,机器学习系统能够发挥的作用的瓶颈取决于训练数据集的质量,并且当遇到他曾经没有遇到过的化合物时,表现非常不好。更有甚者,整个基于神经网络的应用程序是一个黑盒子,我们目前还不知道为什么该系统能够如此地行之有效。

 

很多计算方法会经常推荐在实验室难以生产的化合物,化学家们因此需要艰苦地搞明白这些化合物的配方,这一过程可能需要几个月甚至更久。即是这样,化学家们也不能确定该化合物成形后是否有用。Reymond 的算法对于一个化合物有效与否的预判准确率仅在 5%–10%,这意味着化学家们需要合成 20 种系统判断为可行的化合物,才能保证有一种是有效的。Reymond 说:「我认为人类药物宇宙大爆发的瓶颈在于对化合物的合成过程。」出于这个原因,他最近将他的化学物质数据库在保证药物性能覆盖的前提下缩小到 1000 万种容易合成的化合物。

 

药物公司 Relay Therapeutics 的首席科学家 Mark Murcko 认为,药物计算领域不需要过分关注新算法的研发,而是应该重视训练数据的质量。他说:「优化训练模型的最佳方法之一就在于给他们投喂越来越多、越来越好的数据。」实际上,Relay 以及其他一些药物公司中的化学家们正在紧密地和计算科学家们合作,将计算科学家和算法提出的化合物构想进行合成,并将合成结果作为未来做决定时的参考数据。

 

对于 Hopkins 来说,上述合作至关重要。科学家们花费了好几十年才让机器人能够与人类国际象棋选手较量,才有了 1997 年 IBM 的深蓝系统打败 Garry Kasparov。但这次失败并不代表国际象棋赛事的终结。反之,Kasparov 创造了一支由人类和 AI 共同组成的国际象棋团队。「人机结合能够打败所有人类,而且能打败所有算法。」Hopkins 说,他希望在医药行业,也能同样发生数据红利、创造力以及常识的结合,「我相信我们正处在 Kasparo 和深蓝交锋的时代。」


]]> 原文: http://ift.tt/2x4YTDP
RSS Feed

机器知心

IFTTT

2017年9月29日星期五

惊了,我想找个女朋友---军师(末尾附启事)

原文及作者:The 5 Levels of Meeting AI Rowan Trollope

翻译:HW_哈威

审校:Kaiser

为获得更好的阅读体验,可以来景略集智的专栏前来阅读:智能会议的五重境界 - 集智专栏,每天都有有趣的文章更新~比心


我们现今使用的语音识别设备可以说是世界上最无聊的房客了。"把灯打开",或者"谁赢得了1975年世界系列赛",或者"给我讲个笑话"这样子,很迷。当然,语音机器人技术只是从魔法中剔除的一步,但这些产品有让我们生活中最重要的部分——与同类进行交流上变得更好吗?没有。

但是会好的。机器智能的成长不可避,而且还会搞出来更具感知力更直观的语音机器人。过不了多久,这些AI就会成为我们工作团队中的一员了。这是个好事,我也在追求这个。首先,AI会议机器人会降低我们在参与会议时准备技术条件的认知负荷,人们可以更多去关注重要的会议内容。

但那只是个开始。会议机器人将为我们操作我们无法自己操作的事务。它们最终将可以预测我们的需求,并了解人际关系,甚至全公司的动态。

惊了,快给军师推荐吧,不然军师只能用AI相亲软件找女朋友了 @军师


发展步骤

放心,将来我们不会搞出来可以读心的会议机器人。这种智能需要以下五级来进化:

第一级:指挥与控制

Level 1: Command and Control

首先,我们要知道会议机器人依然是指令与控制模式的机器人,我们可以告诉它"参加会议",然后它就会帮我们做好准备,连按钮什么的都不用按了。这些会议机器人所掌握的词汇有限,对文句的理解能力也有限,还需要用非常明确的方式来把它激活。它们会让会议变得不那么难受,视频拨号什么的技术活都是它来弄。

第二级:自然语言理解

Level 2: Natural-Language Understanding

可以做到基本的语音识别之后,我们就要开始让机器人学会理解文句并知晓会议状态。我们应该可以对机器人说"提醒Sam把这个Presentation发给整个团队。" 可理解需求的2级会议机器人将能够建立基本的语言联系,记录会议情况(比如谁参加了会议,都展示了哪些文件等等),还可以在更多的工作互动细节上进行操作。

第三级:用领域专长进行语义理解

Level 3: Semantic Understanding with Domain Expertise

到了这个级别,会议机器人就可以开始对你讲话了,"我已经分析了你们的会议,这里是我记录的要点。"这个级别的会议机器人会听录会议,还将能够辨别讨论的主题。它会在会后提出它的分析——帮你回忆起会议要点。

机器人会从会议记录中提取词汇云和可能的观点分析,以构建发生的事情的摘要。为了获得更高的准确性,机器人将能够在其分析中纳入公司和领域专有的知识库,如常见问题和术语词典。一个3级的会议机器人将超越操作上的便利性;它会通过做一些会议内容的认知处理来帮助人们实现他们的目标。

现在已经有了半可靠的会后支持工具来总结会议主题和观点,我相信我们在5年前就可以制造足够可靠的3级机器人并投入市场了。通过人类的话语来分析人类意图远比将话语转为文字复杂得多(现在已经可以做到了),而且这也远远超过当今的自然语言科技水平。但我们正在往这个方向努力。

第四级:智慧且主动的团队成员

Level 4: Intelligent and Proactive Team Member

到了这个级别,机器人在理解人类意图方面已经足够精确,它们将会被允许实时参加会议:"既然您想知道三年内市场预测,那么以下是高德纳咨询公司的最新报告"

这个级别的AI或许也可以理解非语言的人际交流。如果你在会上看了看某人并说"所以是你来跟进?",机器人就会理解你是在对谁说话,你说的是什么意思,以及对方是否同意跟进。机器人将能够在会后与人类协同工作,帮助他们"说到做到"。

4级会议机器人可以通过在会后继续辅助人类正确工作来帮助团队获得成功。 4级会议AI的完全体将可以感知并理解全部的人类交流形式,尤其是非语言交流中的大部分形式。AI如何运用可能与人们实际说的不一致的交流内容,对开发人员而言会是一个有趣的挑战。

第五级:团队与策略智囊

Level 5: Team and Strategic Intelligence

4级机器人可以帮助单独的团队获得成功,但5级的机器人将能够让单独的团队进行合作。在这个乌托邦(或是反乌托邦,就看你怎么看了)的级别,思科Emerge项目的高级总监,我们的研究骨干Andy Payne的说法是:"会议智能不仅仅会参加一场会议,而是会参加每一场会议。"

这个级别的机器人了解重叠的会议主题,员工的个人技能,以及全公司的工作项目,全部基于从会议内容收集的数据,还包括聊天和电子邮件数据挖掘在内的社交网络分析。一个5级机器人或许能了解公司的总体目标,还可以对团队成员的项目建言献策,还能基于目标、项目需求和个人能力为不同的人牵线搭桥。

一个5级机器人可以通过改善团队和人际关系动态,对公司绩效产生可衡量的影响。

真正的Level 5

在今天还没人能接受这样一个机器人老板,或许永远也不会,但如果我们扩大人工智能、机器学习、社交数据挖掘的趋势线,那么就肯定可以创造出接受这种情况这种能力。


人类才会赢

长久以来,技术提高了我们作为知识型员工的个人能力。但AI起势不可避,当AI真正应用于公司与团队时,那一定会很有趣。

要我说,我感觉这对人类是有益的。更成功的团队工作是更加愉悦的。为有AI加成的公司工作意味着我们有更多的机会获得成功,还有更多灵活性来做我们认为有高回报的工作。我们制作的AI工具是否令我们的生活更加美好还是未知数,但如果我们用这种想法来发展科技,那么结果就会是肯定的。

如果你有漂亮的单身女生,不如介绍给军师 @军师

因为军师想跟她聊聊,看看她的英语能力如何,能不能胜任我们的翻译职位:景略集智(https://jizhi.im)再招个翻译

做了一点微小的贡献,谢谢大家配合上了黑车。欢迎推荐想要从事翻译工作的朋友与军师取得联系 @军师



via 集智 - 知乎专栏 http://ift.tt/2kaLGIj
RSS Feed

RSS7

IFTTT

iPhone XX会是什么样?

夏乙 千平 发自 凹非寺

量子位 出品 | 公众号 QbitAI

苹果又悄悄收购了一家AI公司。

这家名为Regaind的法国初创公司, 致力于研发能够分析照片内容的计算机视觉技术。Regaind可以通过美学、锐度、曝光、色调等属性,判断一张照片美不美,能从你拍的一堆照片中,自动找出最佳照片。

不止于此,Regaind还能分析人脸、判断性别、年龄和情绪。这些能力显然能更好的和iPhone X的面部功能识别相结合。

Regaind的技术也许已经应用在新iPhone之中,毕竟年初苹果就已经拿下这家公司。不过果粉们想要体验可能还得再等一阵子。

多年以来,苹果一直通过低调秘密研发+不断收购创业公司等方式,增强自己的技术实力。其中既有面部识别、机器学习等AI领域,也包括常见的硬件创新与提升。

那么苹果手上还有什么黑科技?或者说:

未来的iPhone XX(20)是什么样?

外形和屏幕

iPhone X显然还不完美,为了安置各种传感器,不得不搞出一个"刘海"。

未来,这个"刘海"肯定会彻底消失。苹果已经拥有的十几个专利,也许可以把所有的传感器都隐藏到屏幕下方。届时手机正面将全是屏幕。

"完美"。只能这么形容。

比方,这个预测基于苹果2004年6月就提交的专利,距今已经13年之久。

这个专利描述了一种神奇的技术,在构成显示屏的成千上万的像素点之间,有成千上万个可以独立拍摄并拼接成完整相片的微型摄像头。

这是一个天马行空的想法,从那时开始苹果又提交了很多显示屏下放置摄像头和传感器的专利。

2007年,苹果在另一项专利中,延展了在显示屏下放置摄像头的想法。摄像头上面覆盖的像素点,在非激活状态下可以正常显示图像,一旦进入拍摄模式,这些像素点就会逐渐变得透明,以便屏幕下方的摄像头拍摄照片。

三年后,苹果在2011年提交了一个更大的专利,具体列出了摄像头、传感器、扬声器等元件,如何在显示屏下面工作。这个方法是在屏幕上穿孔,当然尺寸小到人眼无法识别,这个方案丝毫不影响屏幕的正常显示。

如下图所示,显示屏上的孔洞和下面的各种传感器。狂野~

不过这个专利直到今年1月,苹果才获得正式的授权。这些技术可能就在加州某个不起眼的建筑中,秘密进行着研发。

回到屏幕本身,iPhone X将配备一个5.8吋的OLED HDR显示屏,可以显示纯黑色和更为鲜艳的色彩,除非接下来几年有重大进步,未来的iPhone XX可能仍然会使用OLED屏幕。

至于像素密度,虽然iPhone X的458ppi比三星S8的571ppi低,但仍然远远超过视网膜屏的定义,再增加像素密度的意义已经不大。

未来真正让iPhone XX屏幕与众不同的,应该是Pro Motion。

iPhone X没有这个技术,目前只是在最新的iPad Pro上应用了。Pro Motion把显示分辨率从60Hz提高到120Hz,结果是:画面的移动更加流畅。也许不用等到iPhone XX,明年的iPhone上可能就会用到这个技术。

摄像头和传感器

摄像头嘛,自从19世纪以来,就是用来拍照的。

现在,从大家在Flickr上分享的照片来看,拍摄设备前5名都是各代iPhone,绝对可以说是最流行的相机了。

到iPhone X这一代发布,苹果推出了ARKit,iPhone上那个摄像头的功能,终于不止拍照而已了,比拍照好玩的,还多得是。

如果我们回溯一下那些与相机相关的苹果专利和收购,就能大致描绘出未来iPhone 摄像头的样子,也会发现这家公司早在2015年就为未来几十年的AR和图像技术发展做好了准备。

LinX的摄像头模块

我们来看一下苹果2015年收购的以色列摄像头模块公司LinX。

LinX的专长是将不同大小、不同焦距的镜头组合成一个"多镜头相机",并设计软件,将不同镜头采集到的数据集合到一张特殊的交互式照片上。

和现在的双镜头背景虚化是一个道理。

收购LinX之后不到一个月,苹果申请了一份专利:基于灵活扫描模式的飞行时间深度映射(Time-of-flight depth mapping with flexible scan pattern)。

这份专利描述了一种用摄像头和深度传感器结合,来为图像中的某个物体创建3D映射的方法。

是不是觉得有点熟悉?这正是iPhone X上那个根据你的表情创建emoji的玩具。但十年之后,它说不定会成为未来iPhone的基本功能。

苹果收购的成像技术公司不止LinX一家,甚至同在2015年,LinX也不是最受关注的一笔收购。

就在收购LinX之后一周,苹果又收购了增强现实软件公司Metaio。法拉利那个能让你虚拟看车的iPad App,就是Metaio做的。

同年秋天,苹果还有一笔收购震惊了整个电影行业:瑞士的实时动作捕捉和图像处理软件公司Faceshift。

不用戴头盔不用贴一脸传感器,Faceshift就能准确地实时捕捉表情,转移到一个虚拟动画角色上。

2017年过去了四分之三,我们才终于能看懂苹果2015年的收购和专利究竟有什么用:他们成了iPhone X上的TrueDepth相机、ARKit等等新功能。

如果要预测十年之后的苹果iPhone XX摄像头会是什么样,我觉得在硬件上:

有3个以上不同焦距的后置摄像头;

有2个以上不同焦距的前置摄像头,藏在屏幕后边;

iPhone背面会有3D物体传感器;

iPhone正面也会有3D物体传感器,藏在屏幕后边。

在手机正面背面都有多摄像头的情况下,用户就能在拍照之后调节精神,而相机背面的3D物体传感器能帮iPhone软件感知物体在3D空间中的位置,而不是和设备的相对位置。

苹果2014年初申请的一份专利描述了一组水平方向的摄像头,具有折叠的光学组件,能够动态移动改变焦距。

从iPhone X中的TrueDepth相机可以看出,摄像头对于苹果来说,不再只是一种拍照用的装置,而是一种用来获取更多周围环境信息的传感器。

对于iPhone XX来说,有新的相机系统和3D传感器还不够,真正能让它从一堆竞品中脱颖而出的是能充分利用从传感器获取的数据的软件,比如说:

摄像头持续扫描周围环境、在3D空间中追踪物体并建模,让iPhone对周围情况具备感知能力;

眼球追踪功能,让软件具备预知能力,通过用户所注意的点来引导交互,苹果2017年初收购的SensoMotoric Instruments就是眼球追踪领域全球领先的公司;

通过摄像头获取的用户脸部数据来解读生理和健康信息;

用先进的图像处理算法,来保证在FaceTime视频聊天时,对面那个人总觉得你在看他;

机器学习的进步能让iPhone实时对周围的物体计数,比如数出教室里有多少人、有几辆车在等红灯……

不需要那个花哨的AR尺子就能即时对物体、空间进行测量,比如说墙有多高、门口多宽等等。

这些都是功能上的小进步,而iPhone最大的进步,会让它从你眼中"消失"。

未来,iPhone会有着真正无边框的的全面屏和众多传感器,软件能识别你的眼睛、iPhone和前方物体的相对位置,实时调整后置摄像头的焦距,让你看着眼前的iPhone,就如同透过一块玻璃看世界。同时,iPhone这块"玻璃"能对你眼前的世界进行修改。

就像MagicLeap视频中展示的那样,这就是增强现实的圣杯。

电池和内部元件

这是一个几乎等于废话的判断:iPhone XX的处理器性能会大大提升,电池容量也将更高。这是技术进步的必然。

不过即便电池容量提升,iOS电源管理原来越好,但由于处理器更快,显示屏像素更多、更亮,耗电量也会相应提升。大概iPhone XX电池续航还是跟现在差不多。

与Android手机相比,苹果好像在增加电池容量方面一直非常克制,或者说这家公司压根就是希望用户使用充电宝之类的产品?

但这并不是说苹果在电池方面没有创新,实际上苹果已经把一项2010年提交的非矩形电池专利投入产品生产。

如上图这种层状结构的电池,首次应用在2015年发布的MacBook之中。每一层都是微米级的厚度。这种电池让工程师可以把更多的电池塞到笔记本里。如果没有这一创新,超薄的Macbook根本做不出来。

2013年,苹果还有一个专利可以提高充电速度、延长寿命、降低平均温度。

至少在处理器这个领域,苹果公司仍然处于手机行业的领先水平。

苹果一直稳步推进A系列处理器的升级,最新的A11 Bionic处理器里,除了CPU还有苹果自行设计的GPU和神经引擎。目前的Android高端机处理器,基本无法与A11 Bionic匹敌,就连全新的MacBook Pro也不是对手。

苹果很喜欢秀这个历代手机处理性能的曲线,未来iPhone XX出现时,这个走势应该更陡峭了。

总结

未来的手机,正面可能就是一块屏幕,其他所有的传感器都会隐藏不见。今年初,设计师Georgy Pashkov制作了一段"iPhone 8"概念视频,其实这看起来更像未来的iPhone XX。

播放

00:00/00:00

全屏

总结一下,(有理有据YY出来的)iPhone XX参数配置:

5.5~5.6吋OLED HDR圆角屏幕,450-550ppi,Pro Motion加持,亮度800-1200cd/㎡,以及:没有刘海。

3个不同焦距的后置摄像头,2个不同焦距的前置摄像头(显示屏之下)

前后3D物体传感器,高级眼球追踪功能

5000~6000mAh层状电池,采用紧凑的梯田式布局

A20处理器,8-10个混合性能内核,同样的处理器也用在Mac平台,解释macOS可以运行在ARM架构上。

最后一个问题:不知道iPhone XX还有几年才能到来。不知道那时候AI等技术会让手机变得多厉害。

以及,不知道那时候的手机市场格局几何。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2yN9w05
RSS Feed

RSS5

IFTTT

JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧!- InfoQ 每周精要848期

「每周精要」 NO. 848 2024/09/21 头条 HEADLINE JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧! 精选 SELECTED C++ 发布革命性提案 "借鉴"Rust...