2018年1月8日星期一

刚刚,百度AI公布最新进展:Apollo2.0,新课程,设全球研究院

夏乙 假装发自 Mandarin Oriental量子位 出品 | 公众号 QbitAI

陆奇和百度团队,刚刚在大洋彼岸的拉斯维加斯,公布了百度AI的最新进展。

核心就两个方面:Apollo(无人车)和DuerOS(语音)。

量子位先把重点干货挑出来说一下。

中国速度

发布会一开始,百度COO陆奇说,AI正在改变世界,变革现有行业,赋能新行业。

而且一切改变正以"中国速度"发生。

陆奇表示,在AI的研发上,中国有结构性优势:人才众多、技术先进、资本充裕、市场广阔。13.8亿人口,11亿台智能手机、7.5亿网民,还有2亿辆汽车和200多家OEM车厂带来了数据获取上的巨大优势。

同时,中国的政策环境也非常有利于AI的发展。这对于所有人来说其实都是好事。陆奇说:"AI无国界,创新普惠全球。"

在中国的利好环境下,百度要做的是拥抱机会去创新、去引领、服务于整个世界。

Apollo2.0发布

  • Apollo自动驾驶开放平台迄今"最强版本"
  • 支持简单城市道路自动驾驶
  • 已拥有16.5万行代码,每季度新增6.5万行代码
  • 云端服务、软件、硬件、车辆四大模块全部开放
  • 强化自定位、感知、规划决策和云端仿真等能力
  • 合作伙伴规模超过90家
  • 新设立Apollo全球研究院
  • 与Udacity合作推自动驾驶课程
  • 与微软、TomTom等展开合作

DuerOS生态新进展

2017百度AI开发者大会之后半年时间里,DuerOS已新增130余家合作伙伴、落地硬件解决方案超过20个、每月新增5款以上搭载DuerOS的设备。

这次DuerOS与合作伙伴一起发布多款新产品。

干货以上。

以下是这次百度发布会的全程详情:

陆奇登台就说,今天要发布人工智能新系统、新产品,也要向世界展示百度正如何以中国速度进行着加速创新。

然后,他又宣告了AI时代的到来。仅仅51天前,李彦宏站在北京CBD的百度世界大会舞台上,宣告我们正处在AI时代的黎明。

陆奇说,AI时代已经到来,而且它具有深远的社会和经济影响。它将驱动即将到来的第四次工业革命。为什么?为什么它有如此大的力量?这是因为AI技术给了我们前所未有的能力。

经历了蒸汽机到电力再到计算机互联网带来的变革之后,AI再次为我们带来了前所未有的力量。在与数据交互的过程中,由硬件、软件、算法组合而成的AI系统能够获取知识、应用知识、达到目标。数据在其中扮演了重要的角色,让人工智能更快速地学习。

获取更多数据对于人工智能的创新速度来说,是一个决定性因素。

AI正在改变世界,变革现有行业,赋能新行业。

陆奇说AI技术已经在很大范围内得到了广泛应用,在改变和革新现有产业、创建强大的新产业。这也是为什么"China+AI"将有一个特别的机会来快速释放更多AI创新的原因。

这次陆奇要在国际舞台上展示的,是"AI的中国速度",而且中美之间的差距正在缩小。

他说,在AI的研发上,中国有结构性优势:人才众多、技术先进、资本充裕、市场广阔。历史上,美国是惟一拥有所有这些要素的国家。但现在中国也拥有了所有这些要素。

我们生活的国家有13.8亿人口,11亿台智能手机、7.5亿网民,还有2亿辆汽车和200多家OEM车厂。这些人口和设备带来了海量的数据。

同时,中国的政策环境也非常有利于AI的发展,政府已经表露出长期持续投资的决心,把AI写进了十三五规划,国务院还专门印发了《新一代人工智能发展规划》。

中国的巨大优势其实对全球来说都是好事,现在除了美国之外,中国的公司也可以做更多的事。陆奇说:"AI没有国界,创新普惠全球。"

对我们在中国科技行业的所有人来说,进行AI创新将使我们能够拥抱机会、引领发展和服务世界各地更多的人,因为通过共同努力我们能够改变世界、使其成为一个更美好的地方。

陆奇说:"百度正是为所有这一切而生,我们正在极为努力地推进所有这些创新。这里我对本公司做一个简单介绍:"

"对大家来说,很简单——百度实质上就是中国的谷歌。"

百度是最早开始做AI研发的公司之一。从2013年建立深度学习研究院起,百度的AI研发每年都在加速。

2014年,百度硅谷实验室,也就是百度研究院成立;2015年,DuerOS诞生;2016年,百度自动驾驶汽车上路,百度大脑诞生。

而2017年,是百度AI进展快速爆发的一年,在组织架构上,先后牵头组建了深度学习国家级实验室,成立了AR实验室,开设了第二个硅谷实验室和西雅图实验室;在产品上,推出了Apollo平台、DuerOS开放平台、自动驾驶国家人工智能开放创新平台,还发布了raven H智能音箱。另外,百度还和雄安签订了战略协议,打造AI-City智能城市。

"今后,百度将是一家AI公司。AI处在推动我们在百度所做所有事情的核心位置。"

陆奇说:首先,我们利用AI来改变和创新百度当前的核心业务——搜索、"手机百度"的个性化信息推送、以及爱奇艺的视频娱乐服务。爱奇艺实质上就是中国的Netflix,但所提供的内容要多得多。

另外,我们还要打造若干新的AI赋能的业务,尤其是用于自动驾驶的Apollo和用于对话式人机交互的DuerOS。这些对于百度来说都是可以把握的巨大商机。它们也都将充分借助百度的核心竞争力和核心资产。这些产品背后的技术驱动是智能云和百度大脑。

百度大脑,从底层向上分为算法、感知、认知和平台四层,用机器学习(深度学习)实现对语音、图像、视频、AR/VR的感知,以及自然语言处理、知识图谱、用户画像等认知能力,最终构成百度的AI开放平台。

最底层的智能云包括运算、存储、网络等基础云服务其上的大数据分析、标注和获取。

综合来讲,百度大脑是推动百度进行大规模创新的强大基础平台,对我们合作伙伴所进行的其他所有有关汽车的创新来说它也是一个强大平台。

百度大脑的开发者数量正在快速增长,AI服务的数量、每天被调用的次数也都非常可观。

陆奇表示,将通过开放APIs和开放平台来共同打造创新生态系统,以加快创新速度。

Apollo

接下来是今天的第一大发布:自动驾驶平台升级版Apollo2.0。

陆奇先简要介绍了Apollo,它是全球第一个、也是最大的自动驾驶平台,去年5月发布,之后发展非常迅速。

他说,Apollo有四个基本原则:

一是开放能力,向所有合作伙伴开放平台的所有自动驾驶能力,在高度碎片化的中国汽车制造市场,有200多家OEM厂商,没有一家有能力像百度这样建立开放平台。

第二是共享数据,每一个合作伙伴都可以使用Apollo,也可以为Apollo做贡献。当合作伙伴为Apollo贡献数据来源的时候,生态中每一方都会收益。模拟引擎会从这些数据中自主学习,变得越来越强大。

然后是加速创新,和持续的共同利益。

阿波罗发展快速,它发布不到一年,已经有了8000多名开发者,90多家开发者伙伴。

陆奇宣布:"今天,我们要发布Apollo2.0。从今天开始,我们会提供更多的能力,向每一个开发者、合作伙伴开放在简单城市道路上自动驾驶的能力。"

接着Apollo平台研发负责人王京傲登场宣讲。

Apollo2.0正式开放是今天的重头戏。

王京傲说,Apollo开放平台目前已拥有16.5万行代码,保持着每季度新增6.5万行代码的快速迭代效率。在GitHub上,Apollo开源代码被开发者"fork"超过1800次。

而2.0版被称为Apollo开放平台上线以来的"最强版本"。升级之处包括:首次开放了安全服务,强化了自定位、感知、规划决策和云端仿真等能力,能够实现简单城市道路自动驾驶。

这些都在此前百度公布的Apollo开放路线图之中。

王京傲表示,Apollo2.0的发布意味着Apollo平台包括云端服务、软件平台、参考硬件平台以及参考车辆平台在内的四大模块已全部点亮。

Apollo系统能提供很好的安全保证。

王京傲介绍了Apollo的一些特性,他还说:前几天,媒体试驾过Apollo2.0的无人车,给出了"无聊"的评价。这是对无人车技术最好的赞美。

设置时间也从30分钟,缩短到30秒。

此前硅谷自动驾驶创业公司AutonomouStuff曾运用Apollo1.0开放的能力,三天改装出循迹自动驾驶汽车。

这一次,AutonomouStuff在一周内将车辆升级为"Apollo2.0版本",能够实现昼夜简单城市道路自动驾驶。

同时,Apollo还宣布将在2018年全面支持包括NVIDIA、Intel、NXP、Renesas在内的四大主流计算平台,推出更低成本的传感器方案,支持小型巴士、SUV、卡车等更多的参考车型,以及提供全球更大范围的高精地图服务。

百度将与奇瑞在2020年量产L3级别自动驾驶汽车,与金龙客车与2018年量产无人驾驶微循环巴士,并与Access LA在2018年底在洛杉矶为当地残障人士推出自动驾驶共享出行服务。

接着陆奇重新登场,他指出政策方面的创新跟技术创新一样重要,甚至更加重要。中国政府政策的大力支持,也让无人驾驶技术快速发展。

陆奇也在现场展示了百度Apollo驱动的的无人车队。

这个无人车队还在北京的清晨、在百度大厦进行了演示,并且通过视频连线的方式,展示给拉斯维加斯现场。

陆奇说这个就是无人车的国家队。

发布会现场,百度宣布与Udacity联合推出面向全球的Apollo自动驾驶在线课程。Udacity创始人特龙也登场介绍,还说了一句:授人以鱼不如授人以渔……

陆奇通过一段短片,展示了百度速度、中国速度。短片中,百度的员工们午夜时分还在各自的岗位上勤奋工作。

插播:量子位现场体验

这次发布会之前,量子位还在百度美研搭乘了Apollo2.0驱动的无人车。还拍了两段小视频。

这是L4级的无人车:

http://ift.tt/2CSsF5x

这是L3级的无人车:undefined_腾讯视频

DuerOS

这次发布会的另一重要内容,就是百度度秘事业部总经理景鲲登台,公布DuerOS生态的最新进展。

景鲲表示,作为百度决胜AI时代的核心业务之一,DuerOS开放平台自发布至今,已经实现了从1.0到2.0版本的升级迭代。

2017百度AI开发者大会之后半年时间里,DuerOS已新增130余家合作伙伴、落地硬件解决方案超过20个、每月新增5款以上搭载DuerOS的设备。

目前,DuerOS已与中信国安广视、小鱼在家、海尔、美的、联想、哈曼、TCL、小米、高通等众多产业链上下游企业达成合作。

景鲲表示,DuerOS也在以中国速度快速发展。

DuerOS之前已经宣布升级到2.0版本。

现场播放了一段短片,展示了DuerOS生活的日常。

undefined_腾讯视频

景鲲又提及了DuerOS和渡鸦合作的raven H智能音箱等产品。

现场还发布了三款搭载DuerOS的新产品。

首先是Sengled生迪智能音箱灯。

然后是小鱼在家CEO宋晨枫登台介绍,小鱼在家发布的新产品是VS1智能视频音箱。

最后一款产品是百度日本公司和极米合作推出的智能投影仪。

最后一款产品是百度日本公司和极米合作推出的智能投影仪。

百度AI全球合作

最后登场的是百度总裁张亚勤。

他从另一方面介绍了Apollo的最新进展:Apollo已与多家国际巨头达成合作,合作伙伴规模超过90家。

张亚勤提到了高通。

还有,Apollo将基于微软云Azure在中国以外的地区为全球合作伙伴提供自动驾驶服务;百度还将与TomTom合作开展全球高精地图服务。

此外,Apollo首个海外项目落地新加坡,将与新加坡智能出行公司AMI成立合资公司,并参与新加坡路管局扶持的IUGO智慧出行计划。

张亚勤还宣布百度将成立多个Apollo全球研究院,以百度位于北、上、深、硅谷、西雅图的技术中心为起点,继续在全球范围内招募自动驾驶人才。

最后合作伙伴和百度高管一起登台。

陆奇最后说:人工智能正在改变世界,让我们共同用中国速度改变世界,大家共同努力。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2mdnQts
RSS Feed

RSS5

IFTTT

刚刚,百度AI公布最新进展:Apollo2.0,新课程,设全球研究院

夏乙 假装发自 Mandarin Oriental量子位 出品 | 公众号 QbitAI

陆奇和百度团队,刚刚在大洋彼岸的拉斯维加斯,公布了百度AI的最新进展。

核心就两个方面:Apollo(无人车)和DuerOS(语音)。

量子位先把重点干货挑出来说一下。

中国速度

发布会一开始,百度COO陆奇说,AI正在改变世界,变革现有行业,赋能新行业。

而且一切改变正以"中国速度"发生。

陆奇表示,在AI的研发上,中国有结构性优势:人才众多、技术先进、资本充裕、市场广阔。13.8亿人口,11亿台智能手机、7.5亿网民,还有2亿辆汽车和200多家OEM车厂带来了数据获取上的巨大优势。

同时,中国的政策环境也非常有利于AI的发展。这对于所有人来说其实都是好事。陆奇说:"AI无国界,创新普惠全球。"

在中国的利好环境下,百度要做的是拥抱机会去创新、去引领、服务于整个世界。

Apollo2.0发布

  • Apollo自动驾驶开放平台迄今"最强版本"
  • 支持简单城市道路自动驾驶
  • 已拥有16.5万行代码,每季度新增6.5万行代码
  • 云端服务、软件、硬件、车辆四大模块全部开放
  • 强化自定位、感知、规划决策和云端仿真等能力
  • 合作伙伴规模超过90家
  • 新设立Apollo全球研究院
  • 与Udacity合作推自动驾驶课程
  • 与微软、TomTom等展开合作

DuerOS生态新进展

2017百度AI开发者大会之后半年时间里,DuerOS已新增130余家合作伙伴、落地硬件解决方案超过20个、每月新增5款以上搭载DuerOS的设备。

这次DuerOS与合作伙伴一起发布多款新产品。

干货以上。

以下是这次百度发布会的全程详情:

陆奇登台就说,今天要发布人工智能新系统、新产品,也要向世界展示百度正如何以中国速度进行着加速创新。

然后,他又宣告了AI时代的到来。仅仅51天前,李彦宏站在北京CBD的百度世界大会舞台上,宣告我们正处在AI时代的黎明。

陆奇说,AI时代已经到来,而且它具有深远的社会和经济影响。它将驱动即将到来的第四次工业革命。为什么?为什么它有如此大的力量?这是因为AI技术给了我们前所未有的能力。

经历了蒸汽机到电力再到计算机互联网带来的变革之后,AI再次为我们带来了前所未有的力量。在与数据交互的过程中,由硬件、软件、算法组合而成的AI系统能够获取知识、应用知识、达到目标。数据在其中扮演了重要的角色,让人工智能更快速地学习。

获取更多数据对于人工智能的创新速度来说,是一个决定性因素。

AI正在改变世界,变革现有行业,赋能新行业。

陆奇说AI技术已经在很大范围内得到了广泛应用,在改变和革新现有产业、创建强大的新产业。这也是为什么"China+AI"将有一个特别的机会来快速释放更多AI创新的原因。

这次陆奇要在国际舞台上展示的,是"AI的中国速度",而且中美之间的差距正在缩小。

他说,在AI的研发上,中国有结构性优势:人才众多、技术先进、资本充裕、市场广阔。历史上,美国是惟一拥有所有这些要素的国家。但现在中国也拥有了所有这些要素。

我们生活的国家有13.8亿人口,11亿台智能手机、7.5亿网民,还有2亿辆汽车和200多家OEM车厂。这些人口和设备带来了海量的数据。

同时,中国的政策环境也非常有利于AI的发展,政府已经表露出长期持续投资的决心,把AI写进了十三五规划,国务院还专门印发了《新一代人工智能发展规划》。

中国的巨大优势其实对全球来说都是好事,现在除了美国之外,中国的公司也可以做更多的事。陆奇说:"AI没有国界,创新普惠全球。"

对我们在中国科技行业的所有人来说,进行AI创新将使我们能够拥抱机会、引领发展和服务世界各地更多的人,因为通过共同努力我们能够改变世界、使其成为一个更美好的地方。

陆奇说:"百度正是为所有这一切而生,我们正在极为努力地推进所有这些创新。这里我对本公司做一个简单介绍:"

"对大家来说,很简单——百度实质上就是中国的谷歌。"

百度是最早开始做AI研发的公司之一。从2013年建立深度学习研究院起,百度的AI研发每年都在加速。

2014年,百度硅谷实验室,也就是百度研究院成立;2015年,DuerOS诞生;2016年,百度自动驾驶汽车上路,百度大脑诞生。

而2017年,是百度AI进展快速爆发的一年,在组织架构上,先后牵头组建了深度学习国家级实验室,成立了AR实验室,开设了第二个硅谷实验室和西雅图实验室;在产品上,推出了Apollo平台、DuerOS开放平台、自动驾驶国家人工智能开放创新平台,还发布了raven H智能音箱。另外,百度还和雄安签订了战略协议,打造AI-City智能城市。

"今后,百度将是一家AI公司。AI处在推动我们在百度所做所有事情的核心位置。"

陆奇说:首先,我们利用AI来改变和创新百度当前的核心业务——搜索、"手机百度"的个性化信息推送、以及爱奇艺的视频娱乐服务。爱奇艺实质上就是中国的Netflix,但所提供的内容要多得多。

另外,我们还要打造若干新的AI赋能的业务,尤其是用于自动驾驶的Apollo和用于对话式人机交互的DuerOS。这些对于百度来说都是可以把握的巨大商机。它们也都将充分借助百度的核心竞争力和核心资产。这些产品背后的技术驱动是智能云和百度大脑。

百度大脑,从底层向上分为算法、感知、认知和平台四层,用机器学习(深度学习)实现对语音、图像、视频、AR/VR的感知,以及自然语言处理、知识图谱、用户画像等认知能力,最终构成百度的AI开放平台。

最底层的智能云包括运算、存储、网络等基础云服务其上的大数据分析、标注和获取。

综合来讲,百度大脑是推动百度进行大规模创新的强大基础平台,对我们合作伙伴所进行的其他所有有关汽车的创新来说它也是一个强大平台。

百度大脑的开发者数量正在快速增长,AI服务的数量、每天被调用的次数也都非常可观。

陆奇表示,将通过开放APIs和开放平台来共同打造创新生态系统,以加快创新速度。

Apollo

接下来是今天的第一大发布:自动驾驶平台升级版Apollo2.0。

陆奇先简要介绍了Apollo,它是全球第一个、也是最大的自动驾驶平台,去年5月发布,之后发展非常迅速。

他说,Apollo有四个基本原则:

一是开放能力,向所有合作伙伴开放平台的所有自动驾驶能力,在高度碎片化的中国汽车制造市场,有200多家OEM厂商,没有一家有能力像百度这样建立开放平台。

第二是共享数据,每一个合作伙伴都可以使用Apollo,也可以为Apollo做贡献。当合作伙伴为Apollo贡献数据来源的时候,生态中每一方都会收益。模拟引擎会从这些数据中自主学习,变得越来越强大。

然后是加速创新,和持续的共同利益。

阿波罗发展快速,它发布不到一年,已经有了8000多名开发者,90多家开发者伙伴。

陆奇宣布:"今天,我们要发布Apollo2.0。从今天开始,我们会提供更多的能力,向每一个开发者、合作伙伴开放在简单城市道路上自动驾驶的能力。"

接着Apollo平台研发负责人王京傲登场宣讲。

Apollo2.0正式开放是今天的重头戏。

王京傲说,Apollo开放平台目前已拥有16.5万行代码,保持着每季度新增6.5万行代码的快速迭代效率。在GitHub上,Apollo开源代码被开发者"fork"超过1800次。

而2.0版被称为Apollo开放平台上线以来的"最强版本"。升级之处包括:首次开放了安全服务,强化了自定位、感知、规划决策和云端仿真等能力,能够实现简单城市道路自动驾驶。

这些都在此前百度公布的Apollo开放路线图之中。

王京傲表示,Apollo2.0的发布意味着Apollo平台包括云端服务、软件平台、参考硬件平台以及参考车辆平台在内的四大模块已全部点亮。

Apollo系统能提供很好的安全保证。

王京傲介绍了Apollo的一些特性,他还说:前几天,媒体试驾过Apollo2.0的无人车,给出了"无聊"的评价。这是对无人车技术最好的赞美。

设置时间也从30分钟,缩短到30秒。

此前硅谷自动驾驶创业公司AutonomouStuff曾运用Apollo1.0开放的能力,三天改装出循迹自动驾驶汽车。

这一次,AutonomouStuff在一周内将车辆升级为"Apollo2.0版本",能够实现昼夜简单城市道路自动驾驶。

同时,Apollo还宣布将在2018年全面支持包括NVIDIA、Intel、NXP、Renesas在内的四大主流计算平台,推出更低成本的传感器方案,支持小型巴士、SUV、卡车等更多的参考车型,以及提供全球更大范围的高精地图服务。

百度将与奇瑞在2020年量产L3级别自动驾驶汽车,与金龙客车与2018年量产无人驾驶微循环巴士,并与Access LA在2018年底在洛杉矶为当地残障人士推出自动驾驶共享出行服务。

接着陆奇重新登场,他指出政策方面的创新跟技术创新一样重要,甚至更加重要。中国政府政策的大力支持,也让无人驾驶技术快速发展。

陆奇也在现场展示了百度Apollo驱动的的无人车队。

这个无人车队还在北京的清晨、在百度大厦进行了演示,并且通过视频连线的方式,展示给拉斯维加斯现场。

陆奇说这个就是无人车的国家队。

发布会现场,百度宣布与Udacity联合推出面向全球的Apollo自动驾驶在线课程。Udacity创始人特龙也登场介绍,还说了一句:授人以鱼不如授人以渔……

陆奇通过一段短片,展示了百度速度、中国速度。短片中,百度的员工们午夜时分还在各自的岗位上勤奋工作。

插播:量子位现场体验

这次发布会之前,量子位还在百度美研搭乘了Apollo2.0驱动的无人车。还拍了两段小视频。

这是L4级的无人车:

http://ift.tt/2CSsF5x

这是L3级的无人车:undefined_腾讯视频

DuerOS

这次发布会的另一重要内容,就是百度度秘事业部总经理景鲲登台,公布DuerOS生态的最新进展。

景鲲表示,作为百度决胜AI时代的核心业务之一,DuerOS开放平台自发布至今,已经实现了从1.0到2.0版本的升级迭代。

2017百度AI开发者大会之后半年时间里,DuerOS已新增130余家合作伙伴、落地硬件解决方案超过20个、每月新增5款以上搭载DuerOS的设备。

目前,DuerOS已与中信国安广视、小鱼在家、海尔、美的、联想、哈曼、TCL、小米、高通等众多产业链上下游企业达成合作。

景鲲表示,DuerOS也在以中国速度快速发展。

DuerOS之前已经宣布升级到2.0版本。

现场播放了一段短片,展示了DuerOS生活的日常。

undefined_腾讯视频

景鲲又提及了DuerOS和渡鸦合作的raven H智能音箱等产品。

现场还发布了三款搭载DuerOS的新产品。

首先是Sengled生迪智能音箱灯。

然后是小鱼在家CEO宋晨枫登台介绍,小鱼在家发布的新产品是VS1智能视频音箱。

最后一款产品是百度日本公司和极米合作推出的智能投影仪。

最后一款产品是百度日本公司和极米合作推出的智能投影仪。

百度AI全球合作

最后登场的是百度总裁张亚勤。

他从另一方面介绍了Apollo的最新进展:Apollo已与多家国际巨头达成合作,合作伙伴规模超过90家。

张亚勤提到了高通。

还有,Apollo将基于微软云Azure在中国以外的地区为全球合作伙伴提供自动驾驶服务;百度还将与TomTom合作开展全球高精地图服务。

此外,Apollo首个海外项目落地新加坡,将与新加坡智能出行公司AMI成立合资公司,并参与新加坡路管局扶持的IUGO智慧出行计划。

张亚勤还宣布百度将成立多个Apollo全球研究院,以百度位于北、上、深、硅谷、西雅图的技术中心为起点,继续在全球范围内招募自动驾驶人才。

最后合作伙伴和百度高管一起登台。

陆奇最后说:人工智能正在改变世界,让我们共同用中国速度改变世界,大家共同努力。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2mdnQts
RSS Feed

RSS5

IFTTT

成就护肤大业,除了负责清空购物车的男友,妹子们还需要一位AI皮肤顾问

撰文 | 高静宜

编辑 | 微胖


「花几百块钱买一盒面膜说巨补水,难道还能把葡萄干变回葡萄么!」


《前任 3》里,与前任分手后的孟云和余飞共赴一对双胞胎的约会之前,揶揄前任时说道。


或许有一天,AI 能够告诉孟云和余飞答案。


前不久,美图公司的「AI 大脑」——美图影像实验室 MTLab 正式发布了自己研发的 AI 测肤技术——MTskin,并将这款技术部署在了美图美妆电商平台。


用户不仅可以享受「AI 皮肤科大夫」提供的测肤服务,还能获取定制化肤质报告,包括肤质、肤色、肤龄、毛孔、黑眼圈等肤质信息。



图片来自知乎网友 windleavez 在「皮肤的好坏对颜值的改变有多大?」下的回答,获赞 3.6k


「护肤」是女人的永恒话题。女人败家护肤品,几乎从来不手软。


然而,女性挑选护肤品的过程,在追求科学的理工男看来,无异于「玄学」。连自己的真实皮肤状况都不了解,何谈「对症下药」?盲目跟风或者只追求高价护肤品,结果往往只能适得其反。


「我们希望通过皮肤检测,让化妆品推荐或者导购这种具有广告和玄学性质的东西变得更加具有理论基础,而且能够被证实。」美图 CTO 张伟说道。


MTskin 可以帮助女孩们搞清楚自己的肤质问题,进而推荐合适的护肤品。用户所要做的仅仅是对着手机来一张自拍照(通过后置摄像头),然后坐等程序给出分析结果。


正确的打开「姿势」



图为深夜加班归来的程序员小姚使用「美图美妆」APP 进行皮肤测试得到的肤质分析报告


利用人工智能算法进行肤质检测,并非美图独家。


曾因卷入天猫抄袭风波而引起关注的护肤 APP「你今天真好看」,也使用了人工智能技术,主打「拍照轻松测肤质」功能。


与此同时,各大美妆护肤品牌也在尝试探索前沿科技在智能肤质检测上的潜能。


但是,MTskin 的独特优势在于测肤定位在医疗级别。


美图影像实验室已经与权威机构上海市皮肤病医院合作,该医院承担了中国 70% 到 80% 的化妆品功效测试任务。上海市皮肤病医院的主治医师不仅会给予团队专业指导,还会帮助团队完成数据标定的工作。为了科学严谨,数据往往需要多位行业专家共同进行多次标注,并统计分析得出最为准确的标注结果。



美图影像实验室技术总监许清泉介绍产品的研发过程


AI 测肤是一个天然的应用场景


要让世界上每个人变得更美,「我们产品与技术研发,都围绕着这个中心。」张伟说。


在谈及为何要做这样一款产品时,美图表示他们想让美「落地」现实。


如果说,此前美图上线的绘画机器人 Andy 等功能能让用户拥有在线美丽形象,那么 AI 测肤则是让虚拟的美丽走进现实,帮助用户在线下生活中拥护真实美丽的容颜。


「对于美图来说,MTskin 技术测肤是一个非常好的天然场景。」张伟说道。


其实早在去年 10 月初,美图就推出电商平台「美图美妆」,并将皮肤测试技术应用到了这一场景:平台会根据用户的肤质报告为其推荐合适的商品。


在上线至今的三个月时间里,平台大约完成了 2300 多万次测肤,还曾登上 App Store 购物榜的第三名。在推出皮肤检测功能之后,团队发现用户消费和购买行为有很大程度提升。




即使是专业的皮肤科医生也无法一眼判定皮肤状况,需要患者复诊,因此系统也需要积累数据。在积累了大量用户照片后,系统预测与推荐也越来越精准。


「目前还是一个比较初始的版本,我们内部对这个项目有一个两至三年的长线规划。」张伟告诉机器之能。


据透露,美图还投资了台湾可以实现医学级皮肤检测的硬件公司。另外,公司还考虑资助一些皮肤病论坛,帮助医生挖掘人工智能技术在皮肤科领域的价值,完成初步诊断的过程。


另外,美图上线的 AI 测肤功能仅能为用户推荐合适的产品,无法判断这款产品是否确实对用户产生积极效果。


「例如,一款兰蔻眼霜是否对 28 岁的干皮有效,这些数据都很空白。」张伟表示。


美图已经与一家名为 Landproof 的公司展开合作。该公司是一家第三方检测实验室,为化妆品生产企业及科研机构提供化妆品人体安全与功效检测服务,能够针对小样本完成临床试验,有助于美团构建更加全面的数据库。 


「我们希望自己的产品是一款具有可行性(医学意义上)、精准分类的推荐工具。」张伟说道。


研发过程中所遇到的那些「坑」


现在,这个项目已经成为美图影像实验室的重点工作之一。MTskin 也成为美图影像实验室第九大核心技术。


回忆当初,每一款产品研发的过程中总会遇到一些难题。就肤质问题给出判断,更加不易。


最大挑战就是各手机厂商自动白平衡算法并不相同,这会直接影响肤质测试结果。


目前,团队的解决方案是利用闪光灯完成拍照。闪光灯的分布比较均衡,基本可以真实还原用户肤质情况。但是,有的手机厂商对闪光灯的算法会有些许调整,导致用户在不同机型上的测试结果会存在差异。此外,肤质测试需要像素清晰的照片,对手机摄像头存在一定性能要求。目前,美图的 AI 测肤功能只能使用手机后置摄像头拍摄。


张伟表示,在摄像头感光面积不足的情况下,很难区分痘痘与噪声。同时,外界光线因素也会对肤色评估造成影响。未来,团队会考虑引入一些接触式的皮肤检测设备,将其与现有的图像进行结合,从而实现更为接近生理学、更为精准的数据匹配。


除了硬件设备上的局限性,在软件算法上,如何辨别痘痘、斑和黑头也有讲究。张伟表示,不能简单地用深度学习的方案进行处理,团队也结合使用了传统的机器学习算法。



许清泉介绍算法实现流程


例如,痘痘不太可能出现在某些部位上,就先对其进行分割,分割完成后把位置的边缘检测出来再提交给深度神经网络进行分类。因此整个团队的技术人员一部分进行传统算法的相关工作,另一部分则针对深度神经网络进行模型及参数的优化及改善。


「我们在 2018 年的目标是,挖过的坑尽量实现最高水准,并且不再给自己挖新坑。」张伟说道。


目前,美图影像实验室种,大约有 30% 的技术人员的研发工作不以产品驱动为导向,专注研究业内最前沿的论文以及关注行业内顶尖学者的研发进展。这些技术人员会站在研发角度,测试可能改变公司目前产品或者产品结构的思路或方案,不断提升产品技术实力。


有趣的是,美图影像实验室成员绝大部分为理工男。


「好在团队里还是有女生可以从女生的角度出发给出建议。」张伟笑着说道。比如,女性产品经理会告诉研发人员,哪些展示皮肤状况的方式会让女生心生反感。


「一开始我们不敢展示太多,担心太过直接会影响用户心理,但是,最终还是把真实情况告诉用户。即便如此,用户还是会默默地测试,如果皮肤状况有改善,她们也会很开心。」


谈及未来研究规划和发展方向,张伟表示,美图影像实验室有意尝试参加一些公开挑战赛以证明自己的实力。另外,也会在手绘机器人 Andy 基础上,继续开发半监督学习的潜力,尝试利用有限数据开发出更多有趣的效果。


]]> 原文: http://ift.tt/2qEfosl
RSS Feed

机器知心

IFTTT

到2020年,智能手机将拥有十项AI功能,有些可能会出乎你意料

编译 | Rik R、Edison Ke

来源 | Techcrunch

作者 | Natasha Lomas


近日,Gartner 列出了人工智能手机的十大「高影响力」应用,并称这些应用将为设备供应商赋予「更高级」的用户体验,从而为客户带来更多价值。


它还预测,到 2022 年底,拥有人工智能特性的智能手机将占到全球出货量的 80%,而这一数字在 2017 年只有 10%。


在 Gartner 看来,由于数据的处理和存储过程是在本地进行,因而人工智能设备的普及意味着数据安全性和电池性能的提升。


在 2020 年,搭载以下 10 种 AI 功能的智能手机将走入我们的生活。而这些新功能在带给人们期待的同时,也不可避免地引发人们的担忧。


1)用户行为预测



「智能手机将成为用户个人的延伸,能够识别用户并预测他们下一步的行动。它将会知道你是什么样的人,你想要什么,你什么时候想要,你想要它做什么,并按你的意愿执行任务。你的智能手机会 24 小时追踪你的动态,帮助你学习、计划并解决问题,」Gartner 分析师 Angie Wang 说,「智能设备将利用其传感器、摄像机和数据来自动完成这些任务。例如,在智能家居场景中,它可以命令真空吸尘器在无人的时候打扫,或者在你回家前 20 分钟打开电饭锅。」


事实上,这项追踪服务也在无时无刻地监视用户的一举一动,以便在其算法黑盒子里复制一个数码版替身。


那么,它是否会不厌其烦地试图预测用户的所欲所求呢?如果人工智能的选择不对用户的胃口,或许更糟,那该怪谁呢?


比如,人工智能派真空吸尘器去打扫孩子们的蚂蚁洞穴,或者,如果打开了空电饭煲(假如用户忘记将开关掰起),那么最好是损失一点电费,最坏也就是把房子烧了。


都说人工智能助手很快就会开始真正地了解并帮助人类。但是,除非只做一些简单的事情,比如播放音乐,或者再细一点,找一首相似的音乐来听,以及一些基本的事情,比如搜索某个条目,否则它们比起白痴专家们可能只是有过之而无不及。

2)用户身份验证


「用密码进行身份验证已经显得太过复杂且效率低下,导致安全性差、用户体验差、记忆成本高。而结合了机器学习、生物识别和用户行为的安全技术,则可以提高设备的可用性和自我服务能力。例如在走路、刷二维码、按压点击、翻页滚动和打字输入的时候,无需要密码或主动认证,智能手机能够捕捉并了解用户的行为模式。」 


难道说,不完全放弃隐私就得不到安全吗?如果没有这项技术,用户会被自己的设备拒之屏外吗?


或许用户所期待的是手机在任何其它特定的时刻都是锁着的,因为手机设备是私人物品,而情况并不总是可预测的。


而且,如果用户想和家人分享移动设备呢?难道他们也必须在万能的数码设备之眼前展现自己的生物信息吗?这样的话,要想用人工智能增强型多层生物识别系统来在亲人之间共享设备,是不是反而变得更加困难了?


苹果公司在 iPhone X(不支持多人脸注册)上将指纹生物识别(允许注册多个指纹)换成了面部生物认证系统,可能就是这一情况的展现。


3)情感识别


「情绪感知系统和情感计算,允许智能手机检测、分析、处理和响应人们的情感状态与情绪。虚拟个人助理及其它基于人工智能的会话系统,这些技术的扩散推动了各个行业添加情感智能的需要,以便更好地理解应用情境并增强服务体验。例如,汽车制造商可以使用智能手机的前端摄像头来了解司机的身体状况或测量其疲劳水平,从而提高行车安全性。」


如果广告商也能接触到这种超敏感的情感数据,那么他们会用来做什么?


要想公平客观地讨论情绪感知系统是不可能的。在潜在风险方面,Facebook 提供了一个明确的指引——去年泄露的内部文件表明,社交媒体巨头正在吹嘘其对用户数据的处理能力,将青少年的不安全感当成了其广告销售业务的卖点。因此,虽然情境感知或许会推荐一些实用的功能,深受智能手机用户的追捧并让他们乐在其中,但也具备很高的再开发潜力,且很容易感知到入侵——比如一个青少年在开门时,他的智能手机就知道在什么时候给他推广告,因为此时用户正处于低落的情绪中。


如果本地化运行的情绪感知系统可以保证不泄露情感数据,那么就不必对人工智能设备太过于担心。但是,在智能手机的用户界面中添加人工智能来规范情绪跟踪的做法,无疑会推动类似这种「增强型」服务在其领域的渗透——这取决于个人应用程序开发者(及其对隐私和安全的态度),他们将决定你的情感使用方式。


至于汽车,不是说人工智能会替代人类司机吗?为什么人类需要人工智能看门狗来监视自己在汽车内情感状态(到那时,汽车或将真的变成可供休息和娱乐的体验舱,类似于私人飞机)。对于情绪感知系统面向消费者的安全性辩护似乎令人难以置信。然而,出于各种原因,政府机构和企业仍然愿意随时访问用户的情感数据。


4)自然语言理解


「智能手机中的连续训练和深度学习可以提高语音识别的准确性,同时更好地理解用户的特定意图。例如,当用户说『天气很冷』,按照当时的语境,他或她的真正意图可能是『请在网上订购一件夹克』或『请调高温度』。在出国旅行时,自然语言理解可以作为智能手机中一个接近实时的语音转换器。」


虽然人类梦想着拥有自己的私人乐园,那里可能存在一个绝佳的智能助手,可以在无意间听到其主人说「天气很冷」时自动订购一件完美的外套。


但是,事实是,你的信用卡会与这位智能助手绑在一起,这意味着人工智能将会代你付钱。此外,人工智能还会数据挖掘了解用户之前的外套购买记录,这会直接减少着装风格的选项。


消费者被灌输了很多对于人工智能个人助理的完美想象,这一营销「美梦」充斥着很多悬而未决的疑问,比如该技术到底能够提供多少可靠的实际效用?


除非是那种愿意每年复购同一品牌夹克的人,并认为在线手动搜索点击异常不便。否则谁会觉得这种人工智能会对生活质量有什么明显的改善呢?是直接对一个联网机器人助手说「调高温度」,还是让一个机器人助手一周 7 天 24 小时监视你,只是为了在它无意间听到你谈论天气冷时可以自动应用计算单元来选择升温——而且有可能你只是在谈论天气,也不是秘密要求房子魔法般地主动变温暖。那时,也许你在人工智能身边时(无论何时何地),就需要注意自己的措辞了。


人类在同类之间的交流已经很困难了,期待机器会比我们做得更好,这似乎是异想天开。


5)增强现实与人工智能视觉


「随着 iOS 11 的发布,苹果在系统中添加了一个 AR 工具箱(ARKit)功能,它为开发者提供了新的工具,使应用程序更容易添加 AR。类似地,谷歌宣布了其 ARCore AR 开发者工具,并计划在明年年底前在大约 1 亿台安卓设备上实现 AR 功能。谷歌预计,在明年年底,几乎每款新的安卓手机都将自带 AR 功能。一个 AR 在应用程序中充分利用的例子是,它可以帮助收集用户数据并检测诸如皮肤癌或胰腺癌等疾病。」


虽然不可避免地,大多数 AR 应用程序可能无法真的拥有癌症检测这样好用的功能,但没有人会去拒绝「可能避开严重疾病」的功能。也就是说,一个收集个人数据用于医疗诊断的系统会放大关于健康数据如何被智能手机供应商妥善储存、管理和保护的问题。苹果在健康数据方面一直是积极主动的,但与谷歌不同的是,它的商业模式并不依赖于通过分析用户来销售有针对性的广告,因此在其中存在着有竞争的商业利益类型。


事实上,无论设备上的人工智能怎么样,用户的健康数据似乎不可避免地会被从本地设备上取走,以便第三方诊断应用程序进行处理(这些应用程序希望获得这些数据来帮助改进他们自己的人工智能模型),因此数据保护的顾虑也随之增加。与此同时,强大的人工智能应用程序可能会突然诊断出非常严重的疾病。这也会引发更广泛的问题,比如应用程序如何负责地、善解人意地告知一个人,程序认为他/她有一个严重的健康问题。当顾问是机器人时,「不伤害」就开始变得更加复杂。


6)设备管理


「机器学习将提高设备的性能和待机时间。例如,智能手机可以通过许多传感器来更好地理解和学习用户的行为,比如何时使用哪个应用程序。智能手机将能够将频繁使用的应用程序在后台运行,以快速重新激活应用,或者关闭未被使用的应用程序来节省内存和电池。」


这是又一个基于无处不在的监视和减少的用户代理的人工智能应用——如果用户想让一个通常会直接关闭的应用程序持续运行该怎么办呢?反之亦是问题。


人工智能的模板并不总是能完美地预测变化着的使用情况。


最近,报道揭露了苹果 iOS 为了在电池老化后勉强维持手机性能而限制旧 iPhone 手机性能。针对于此的批评是个重要的警告:消费者可能对因为生产商的设计而丧失设备的控制权做出意想不到的反应。


7)个人分析


「智能手机能够收集数据来进行行为分析和个人分析。用户可以基于他们正在进行的活动和所处的环境(例如,家庭、车辆、办公室或休闲活动)动态地接受保护和帮助。保险公司等服务提供商现在可以更关注用户,而不是资产。例如,他们可以根据客户的驾驶行为来调整汽车保险费率。」


由智能手机传感器数据(如位置、速度、移动等)驱动的基于普遍行为分析的保险费定价当然也可以调整成为一种对设备所有者的惩罚。比如,如果一个人的手机显示他们经常急刹车,或经常在某些区域的超速。那么人工智能不是应该取代驾驶员吗?所以自动驾驶汽车需要驾驶者有驾驶保险吗?或者,传统的汽车保险费不不应该在自动驾驶情况下降到零吗?那么,通过无所不在的个人分析,消费者的利益究竟在哪里呢?


与此同时,歧视性定价是另一个个人分析带来的明显风险。利用智能手机对其主人进行行为分析还能用于什么目的呢?是想知道花在办公室电脑键盘上的时间还是花在电视机前的时间?由于智能手机的普遍存在(也就是「非可穿戴式可穿戴设备」)的普遍存在,几乎每一个日常事物都可能通过常开的人工智能程序进行量化,但这真的是可取的吗?用户意识到自己是在显微镜下,不断地被判断他们是如何生活时,有没有可能不让他们有不适、压力和失去动力的感觉?


8)内容审查/检测


「可以自动检测受限制的内容。可以对令人讨厌的图像、视频或文本进行标记,并且可以启用各种通知警报。计算机识别软件可以检测任何违反法律或政策的内容。例如,在高度保密设施拍摄照片或在公司付费的智能手机上存储高度机密的数据将会通知 IT 部门。」


个人智能手机对用户违反公司 IT 政策的检举听起来就像是来自一部反乌托邦科幻小说。基于人工智能的内容审查也是如此。


其实,人工智能未能正确识别图像,或者将图像完全分错类的例子比比皆是,且越来越多——这也包括被故意掺假的图形愚弄。而科技公司用自己的公司政策以各种方式屏蔽某些类别的内容,或内容的一部分(包括真正的标志性和真正自然的东西)的历史已经不短。我们手中的设备究其根本是由受到自身商业目的和政治压力影响的商业实体控制的,任由这些设备在用户界面上控制我们能够看到什么或做什么,可以说并不明智。这甚至还将标志着用户和他关联的设备之间操控权的颠覆性变化。


9)个性化照相


「个性化照相包含那些能够根据用户个人审美喜好自动美化其照片的智能手机。例如,东西方的审美偏好不同——大多数中国人喜欢雪白的肤色,而西方的消费者更喜欢褐色皮肤。」


在种族歧视的「美化」滤镜方面,人工智能已经有了一段零碎的历史。因此,任何类型的自动调整肤色似乎都是不明智的。放大来看,这种主观性的自动化也同样是一种可怕的简单化——通过侵蚀人们发现其他的视角和美学的途径,从而更加牢固地将用户锁定在人工智能合成的滤镜内。如果人类的眼睛不知不觉地被算法戴上了有色眼镜,那么还哪来的「情人眼里出西施」呢?


10)音频分析


「智能手机的麦克风能够不断地监听真实世界的声音。设备上搭载的人工智能可以分别这些声音,并指导用户或触发事件。例如,智能手机可以听到用户的鼾声,然后触发用户的腕带,以促使用户改变睡眠姿势。」



在卧室、浴室、客厅、厨房、汽车、工作场所、车库、酒店房间里,智能手机的麦克风会不断识别并推断出那些关于你和你生活的一切。人们真的想让一个外部的商业机构以如此亲密的形式来替自己决定如何能最好地系统化生活,甚至有能力左右自己的睡眠状况吗?


人们想要建立的人工智能系统需要近乎极权的数据或数据的访问,然而,消费者主张的数据仅能提供有限的、微不足道的或偶然的效用。


这种差异并不会影响到大型数据挖掘业务,他们的使命是收集大量数据,以便在幕后推动关键的业务人工智能工作。但对于那些要睡在一个主动偷听例如卧室活动的个人设备旁边的智能手机用户来说,这个等式开始显得更加不平衡。即使你个人不介意,不管你周围的其他人喜欢与否,他们的「真实声音」也会被你的手机窥探。你有问过他们是否想要一个人工智能来量化他们发出的声音吗?你打算通知每一个人你正带着一个窃听器吗?


]]> 原文: http://ift.tt/2AGf3oL
RSS Feed

机器知心

IFTTT

M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」-InfoQ每周精要No.900

「每周精要」 NO. 900 2025/11/01 头条 HEADLINE M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」 精选 SELECTED a16z 将 3000 万开发者标价 3 万亿 网友:几个初创公司 + 大模型就...