2017年10月4日星期三

一文看尽Google新品发布会:手机、音箱、笔记本,硬件全面AI化

李根 若朴 发自 十一假期

量子位 报道 | 公众号 QbitAI

AI+软件+硬件,让Google助手无处不在。

这是Google刚刚结束的产品发布会的核心旋律——开门见山、贯穿始终。Google预测:下一次的伟大飞跃,将发生在AI、软件和硬件的交叉路口。

那在这个伟大飞跃前夜,Google都发布了什么?量子位带你一文看尽、一文看懂。

AI为先(AI First)

Google公司CEO劈柴哥(Sundar Pichai)第一个登场。

他首先谈到了最近美国遇到的几个灾难性事件。接着劈柴哥(再次)开始讲述,Google如何从移动为先(Mobile First),转变为AI为先(AI First)。

他举了几个例子,例如如何利用AI和机器学习在非洲处理街景和地图,以及机器学习如何分析旧金山哪些停车场可能还有车位。当然最好的例子是Google翻译。Google现在每天提供超过20亿次的翻译,与2014年相比翻了一番。

怎么理解AI为先的转变?

这里有四个关键组成部分:1)交流和感知(声音、触觉、视觉等);2)环境、多设备可用,无论在手机还是汽车上都能触达;3)不需要你开口问,就能提供你所需要的信息;4)同样不需要你开口问,电脑就能学习和适应你。

"在AI为先的世界里,电脑应该去适应人们的生活方式,而不是人们适应电脑",劈柴哥在台上表示:"我们对这种转变感到兴奋"。

接着开始讲AutoML,这在此前的I/O大会上也讲过。AutoML意在让机器学习模型的设计变得更简单,整个过程更加自动化,有望极大降低未来机器学习的门槛。

劈柴哥举例说,AutoML把图像分类的精确度,从81.5%提升到82.3%,而计算量也有了显著地下降。"AI进步的速度是惊人的",他说。

未来Google还会把更多AI和机器学习技术应用在日常的服务中。

接下来是新硬件时间~

智能音箱新成员:Mini和Max

新硬件发布之前,小结了一下过去的成绩:全球Chromecast设备已经有5500万台;虚拟助手Google助手去年回答了1亿个问题。智能音箱Google Home下一步将进入日本市场——这也是Google Home登陆的首个非拉丁语系国家。

在这次发布会上,智能音箱家族增加两个新成员。更迷你的Google Home Mini,和体型更巨大的Google Home Max。

Google Home Mini是一个饼状的智能音箱,织物表面下有可以亮起的LED灯,可以播放360°的声音,也有支持远场语音技术的麦克风。

颜色方面有灰白、炭黑和珊瑚红三种,售价49美元,10月19日开售。对于这款Mini的思考,Google的说法是"每个房间都可以放一个"。

Google Home Mini

大块头Google Home Max则可以提供更好的音质,配备两个4.5英寸高偏差低音扬声器,以让用户获得更加深度平衡的低音,整体音量则可以比Google Home大20倍。

另外,即便在播放音乐的时候,这个产品也能听到你的指令。这是第一款支持Smart Sound的Google智能音箱,可以根据环境、位置等即刻调整音效。Max也被赋予了"AI音频"体验,它能适应用户具体放置的环境,视具体放置位置自动调整声音。

此外,Max也接入了各种音乐服务,支持蓝牙和辅助端口,共有灰白和炭黑2种颜色,售价399美元,12月份上市销售。

总体来说,Google Home Max主要针对苹果的HomePod、Sonos等对手,当然除了硬件,最大的卖点还是软件方面的Google助手。

Google Home系列

最后,Google Home全家桶到齐后,Google方面还称,内置的Google助手也将有三大新功能:

1)更智能服务日常生活,比如早上醒来一声"hi Google,早上好",就能得到关于用户一天的个性化时间表、通勤状况、天气和新闻;

2)家庭功能,特别是更多涉及儿童的内容,13岁以下的儿童都可以由父母创建一个专属帐户;

3)智能家居,目前Google Home可以控制的智能家居产品达1000个,涉及100多个品牌。

笔记本:Pixelbook

接下来发布的是首款Google笔记本,一款名为Google Pixelbook的高性能Chromebook,结合了笔记本电脑的性能、平板电脑的便携,以及智能手机的个性化。

笔记本外观之下,是用AI技术打通PC和智能手机的想法。在Google Pixelbook上,除了定制的Chrome OS主打快速、易用和安全,还搭载了Google助手,直接语音交互,而且最关键的是,可以应用所有Google play应用商店里的App。

Google Pixelbook

硬件方面,厚10.3mm,重1.1kg,4合1设计,可拆卸键盘,能360°翻转,采用英特尔酷睿i5和i7处理器,最高512GB存储,10小时续航。

售价999美元起,今天开始接受预定,首批面向美国、加拿大和英国三个国家。

同时配套发布的还有Google Pixelbook pen,主要加强笔记本上的交互,使用机器学习进行手写识别,最多10毫秒延时,售价99美元起。

值得注意的是,这是首款搭载Google助手的笔记本电脑,而且可以直接在电脑上使用App,无需再在手机和笔记本之间进行切换。

手机:Google Pixel 2/2XL

接下来是意料之中、曝光最充分的新手机:5英寸的Google Pixel 2和6英寸的Google Pixel 2XL。

Google Pixel 2 / XL

硬件方面,Google Pixel 2是一代的性能升级,而新增的Google Pixel 2XL则配备了18:9的1080p OLED全面屏。这两款产品均是后置指纹、前后各一个摄像头、采用Type-C,且取消了耳机孔。

颜色方面,Google Pixel 2有浅蓝色、黑色和黑白色3种颜色,Google Pixel 2XL则仅有黑色和黑白色2款。不过颜色上也能通过合作方配件玩一些新花样,目前有25家合作伙伴可以搞一些徽章、背壳等个性化方案。

系统方面,Google Pixel 2和Google Pixel 2XL均配备Android 8.0 Oreo。值得一提的还有一个永远在线的显示屏,无需触摸电源按钮,就能了解所有屏幕上的通知/时间。

当然,Google的手机,核心大招都在软件方面,或者说就是AI在手机上应用。

首先还是Google助手,贯穿整个手机使用中,甚至不用唤醒词,直接能在锁屏状态下识别"主人"的声纹,启动相应App或执行具体任务,现场演示了一下"自拍",只需对着麦克风轻声细语一句,Google助手便直接启动相机,并开启自拍模式。这个功能被称为"Active Edge"。

Google Lens Demo

其次是相机,主要有拍照、Google Lens和AR等3大技术应用。

即便在双摄像头成为标配的时代,Google Pixel 2也没有跟风,核心原因是Google团队认为算法能解决的问题,就不劳烦硬件了。

于是这颗后置单摄像头,在Google机器视觉和机器学习的双驱动下,性能比上一代更好,拍照评分从去年的89分提升到了98分——自己创造的记录自己刷新。

此外,这颗摄像头还能在Google Lens的赋能下,让所有的图片、图像信息结构化,比如实时机器翻译;又比如OCR式的图片信息转文字;还有"搜索看到的一切",用户可以在拍下照片的同时,获得相关知识信息,也能通过点击Google相册中的镜头图标来查看地标、书籍、音乐专辑、电影和作品。

Google方面称,未来Google助手中也会加入Lens技术的应用,即直接语音交互完成更多视觉相关功能。

最后还有AR的应用,靠单摄像头,Google Pixel 2就能在家居、游戏等需求中玩转AR。

当然,在Google发布会上,这颗摄像头还有"最快对焦"、四轴防抖、3秒动图拍摄和4K视频录制等能力。

至于拍照之后的免费的无限制的Google云处理,也是附赠的。

总结起来一句话:当所有手机厂商都在把摄像头往美颜方向带时,Google的做法是让摄像头做更多、更实用,而且软件算法能搞定的事儿,决不堆叠硬件。

新手机售价,Google Pixel:2649美元;Google Pixel 2XL:849美元,发布会之后就开售。全球市场来讲,Google Pixel 2离我们最近的开售市场是印度,Google Pixel 2XL则是新加坡。

翻译耳机

新手机之后,Google还推出了配备新耳机的VR产品Google Daydream View,售价99美元,灰、黑和珊瑚红三种颜色,以及买硬件就免费享受所有YouTube的VR资源。

Google Daydream View

不过更激动人心的是一款"翻译耳机"的新产品,名为Google Pixel Buds。

Pixel Buds

Buds外观为无线耳机的形式,把Google助手和Google翻译内置其中,不仅能够读取信息,还支持实时翻译,支持的互译语种达到40种。

其实类似功能的产品中国早已有之,比如讯飞的晓译翻译机,以及与腾讯合作的耳机形态的"时空壶"。

Buds一共有黑、白和蓝三种颜色,5小时续航,还能类似苹果的AirPods,直接通过耳机盒充电,最长续航达24小时。

Pixel Buds充电盒

翻译耳机售价:美国市场159美元,即刻预售,11月份开始也将面向加拿大、英国、德国、澳大利亚和新加坡市场。

归结起来,Pixel Buds是Google把Google助手的所有功能装入"无线耳机"的结果,而且不用掏出手机,就能享受实时翻译。

One More Thing:Google Clips

Google Clips

最后登场的新产品是一款相机,或可以称为"随身记录仪",名为Google Clips。

这是一款类似行车记录仪、家庭记录仪的产品,但更为轻便,甚至可以随身携带,拍摄以图片和几秒的动图为主。

除此之外,最核心的还是软件方面的能力。一是Google云的赋能,无限存储空间,实时同步;二是Google机器学习能力,一方面通过面部识别可以抓拍到清晰稳定的镜头,另一方面是整个机器学习过程就在硬件端本身完成,也就意味着一切都是实时同步进行的,不需要"后期"。

Google Clips拍摄

当然,也可以在Pixel、三星S8和iPhone(6以上)查看,但在Google自家的Pixel手机上,能直接通过Google助手交互、查找。

Clips售价249美元,目标群体是父母和宠物主。具体开售时间未定,只说会尽快。

最后的最后,如果要对这场Google产品发布会做一个概括,大概会有两个感想:

首先,"AI+软件+硬件",会经由Google发起,被更多带入我们的生活,而现阶段Google的"AI+软件+硬件",就是把Google助手装入每一个硬件产品中。

其次,这些产品,无论多么激动人心,暂时与中国用户无缘。

不过,Google在总结时也说:硬件业务才刚刚开始,我们志在长远未来。

最后还有一个官方1分钟视频回顾:

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2ypg8F7
RSS Feed

RSS5

IFTTT

一文看尽Google新品发布会:手机、音箱、笔记本,硬件全面AI化

李根 若朴 发自 十一假期

量子位 报道 | 公众号 QbitAI

AI+软件+硬件,让Google助手无处不在。

这是Google刚刚结束的产品发布会的核心旋律——开门见山、贯穿始终。Google预测:下一次的伟大飞跃,将发生在AI、软件和硬件的交叉路口。

那在这个伟大飞跃前夜,Google都发布了什么?量子位带你一文看尽、一文看懂。

AI为先(AI First)

Google公司CEO劈柴哥(Sundar Pichai)第一个登场。

他首先谈到了最近美国遇到的几个灾难性事件。接着劈柴哥(再次)开始讲述,Google如何从移动为先(Mobile First),转变为AI为先(AI First)。

他举了几个例子,例如如何利用AI和机器学习在非洲处理街景和地图,以及机器学习如何分析旧金山哪些停车场可能还有车位。当然最好的例子是Google翻译。Google现在每天提供超过20亿次的翻译,与2014年相比翻了一番。

怎么理解AI为先的转变?

这里有四个关键组成部分:1)交流和感知(声音、触觉、视觉等);2)环境、多设备可用,无论在手机还是汽车上都能触达;3)不需要你开口问,就能提供你所需要的信息;4)同样不需要你开口问,电脑就能学习和适应你。

"在AI为先的世界里,电脑应该去适应人们的生活方式,而不是人们适应电脑",劈柴哥在台上表示:"我们对这种转变感到兴奋"。

接着开始讲AutoML,这在此前的I/O大会上也讲过。AutoML意在让机器学习模型的设计变得更简单,整个过程更加自动化,有望极大降低未来机器学习的门槛。

劈柴哥举例说,AutoML把图像分类的精确度,从81.5%提升到82.3%,而计算量也有了显著地下降。"AI进步的速度是惊人的",他说。

未来Google还会把更多AI和机器学习技术应用在日常的服务中。

接下来是新硬件时间~

智能音箱新成员:Mini和Max

新硬件发布之前,小结了一下过去的成绩:全球Chromecast设备已经有5500万台;虚拟助手Google助手去年回答了1亿个问题。智能音箱Google Home下一步将进入日本市场——这也是Google Home登陆的首个非拉丁语系国家。

在这次发布会上,智能音箱家族增加两个新成员。更迷你的Google Home Mini,和体型更巨大的Google Home Max。

Google Home Mini是一个饼状的智能音箱,织物表面下有可以亮起的LED灯,可以播放360°的声音,也有支持远场语音技术的麦克风。

颜色方面有灰白、炭黑和珊瑚红三种,售价49美元,10月19日开售。对于这款Mini的思考,Google的说法是"每个房间都可以放一个"。

Google Home Mini

大块头Google Home Max则可以提供更好的音质,配备两个4.5英寸高偏差低音扬声器,以让用户获得更加深度平衡的低音,整体音量则可以比Google Home大20倍。

另外,即便在播放音乐的时候,这个产品也能听到你的指令。这是第一款支持Smart Sound的Google智能音箱,可以根据环境、位置等即刻调整音效。Max也被赋予了"AI音频"体验,它能适应用户具体放置的环境,视具体放置位置自动调整声音。

此外,Max也接入了各种音乐服务,支持蓝牙和辅助端口,共有灰白和炭黑2种颜色,售价399美元,12月份上市销售。

总体来说,Google Home Max主要针对苹果的HomePod、Sonos等对手,当然除了硬件,最大的卖点还是软件方面的Google助手。

Google Home系列

最后,Google Home全家桶到齐后,Google方面还称,内置的Google助手也将有三大新功能:

1)更智能服务日常生活,比如早上醒来一声"hi Google,早上好",就能得到关于用户一天的个性化时间表、通勤状况、天气和新闻;

2)家庭功能,特别是更多涉及儿童的内容,13岁以下的儿童都可以由父母创建一个专属帐户;

3)智能家居,目前Google Home可以控制的智能家居产品达1000个,涉及100多个品牌。

笔记本:Pixelbook

接下来发布的是首款Google笔记本,一款名为Google Pixelbook的高性能Chromebook,结合了笔记本电脑的性能、平板电脑的便携,以及智能手机的个性化。

笔记本外观之下,是用AI技术打通PC和智能手机的想法。在Google Pixelbook上,除了定制的Chrome OS主打快速、易用和安全,还搭载了Google助手,直接语音交互,而且最关键的是,可以应用所有Google play应用商店里的App。

Google Pixelbook

硬件方面,厚10.3mm,重1.1kg,4合1设计,可拆卸键盘,能360°翻转,采用英特尔酷睿i5和i7处理器,最高512GB存储,10小时续航。

售价999美元起,今天开始接受预定,首批面向美国、加拿大和英国三个国家。

同时配套发布的还有Google Pixelbook pen,主要加强笔记本上的交互,使用机器学习进行手写识别,最多10毫秒延时,售价99美元起。

值得注意的是,这是首款搭载Google助手的笔记本电脑,而且可以直接在电脑上使用App,无需再在手机和笔记本之间进行切换。

手机:Google Pixel 2/2XL

接下来是意料之中、曝光最充分的新手机:5英寸的Google Pixel 2和6英寸的Google Pixel 2XL。

Google Pixel 2 / XL

硬件方面,Google Pixel 2是一代的性能升级,而新增的Google Pixel 2XL则配备了18:9的1080p OLED全面屏。这两款产品均是后置指纹、前后各一个摄像头、采用Type-C,且取消了耳机孔。

颜色方面,Google Pixel 2有浅蓝色、黑色和黑白色3种颜色,Google Pixel 2XL则仅有黑色和黑白色2款。不过颜色上也能通过合作方配件玩一些新花样,目前有25家合作伙伴可以搞一些徽章、背壳等个性化方案。

系统方面,Google Pixel 2和Google Pixel 2XL均配备Android 8.0 Oreo。值得一提的还有一个永远在线的显示屏,无需触摸电源按钮,就能了解所有屏幕上的通知/时间。

当然,Google的手机,核心大招都在软件方面,或者说就是AI在手机上应用。

首先还是Google助手,贯穿整个手机使用中,甚至不用唤醒词,直接能在锁屏状态下识别"主人"的声纹,启动相应App或执行具体任务,现场演示了一下"自拍",只需对着麦克风轻声细语一句,Google助手便直接启动相机,并开启自拍模式。这个功能被称为"Active Edge"。

Google Lens Demo

其次是相机,主要有拍照、Google Lens和AR等3大技术应用。

即便在双摄像头成为标配的时代,Google Pixel 2也没有跟风,核心原因是Google团队认为算法能解决的问题,就不劳烦硬件了。

于是这颗后置单摄像头,在Google机器视觉和机器学习的双驱动下,性能比上一代更好,拍照评分从去年的89分提升到了98分——自己创造的记录自己刷新。

此外,这颗摄像头还能在Google Lens的赋能下,让所有的图片、图像信息结构化,比如实时机器翻译;又比如OCR式的图片信息转文字;还有"搜索看到的一切",用户可以在拍下照片的同时,获得相关知识信息,也能通过点击Google相册中的镜头图标来查看地标、书籍、音乐专辑、电影和作品。

Google方面称,未来Google助手中也会加入Lens技术的应用,即直接语音交互完成更多视觉相关功能。

最后还有AR的应用,靠单摄像头,Google Pixel 2就能在家居、游戏等需求中玩转AR。

当然,在Google发布会上,这颗摄像头还有"最快对焦"、四轴防抖、3秒动图拍摄和4K视频录制等能力。

至于拍照之后的免费的无限制的Google云处理,也是附赠的。

总结起来一句话:当所有手机厂商都在把摄像头往美颜方向带时,Google的做法是让摄像头做更多、更实用,而且软件算法能搞定的事儿,决不堆叠硬件。

新手机售价,Google Pixel:2649美元;Google Pixel 2XL:849美元,发布会之后就开售。全球市场来讲,Google Pixel 2离我们最近的开售市场是印度,Google Pixel 2XL则是新加坡。

翻译耳机

新手机之后,Google还推出了配备新耳机的VR产品Google Daydream View,售价99美元,灰、黑和珊瑚红三种颜色,以及买硬件就免费享受所有YouTube的VR资源。

Google Daydream View

不过更激动人心的是一款"翻译耳机"的新产品,名为Google Pixel Buds。

Pixel Buds

Buds外观为无线耳机的形式,把Google助手和Google翻译内置其中,不仅能够读取信息,还支持实时翻译,支持的互译语种达到40种。

其实类似功能的产品中国早已有之,比如讯飞的晓译翻译机,以及与腾讯合作的耳机形态的"时空壶"。

Buds一共有黑、白和蓝三种颜色,5小时续航,还能类似苹果的AirPods,直接通过耳机盒充电,最长续航达24小时。

Pixel Buds充电盒

翻译耳机售价:美国市场159美元,即刻预售,11月份开始也将面向加拿大、英国、德国、澳大利亚和新加坡市场。

归结起来,Pixel Buds是Google把Google助手的所有功能装入"无线耳机"的结果,而且不用掏出手机,就能享受实时翻译。

One More Thing:Google Clips

Google Clips

最后登场的新产品是一款相机,或可以称为"随身记录仪",名为Google Clips。

这是一款类似行车记录仪、家庭记录仪的产品,但更为轻便,甚至可以随身携带,拍摄以图片和几秒的动图为主。

除此之外,最核心的还是软件方面的能力。一是Google云的赋能,无限存储空间,实时同步;二是Google机器学习能力,一方面通过面部识别可以抓拍到清晰稳定的镜头,另一方面是整个机器学习过程就在硬件端本身完成,也就意味着一切都是实时同步进行的,不需要"后期"。

Google Clips拍摄

当然,也可以在Pixel、三星S8和iPhone(6以上)查看,但在Google自家的Pixel手机上,能直接通过Google助手交互、查找。

Clips售价249美元,目标群体是父母和宠物主。具体开售时间未定,只说会尽快。

最后的最后,如果要对这场Google产品发布会做一个概括,大概会有两个感想:

首先,"AI+软件+硬件",会经由Google发起,被更多带入我们的生活,而现阶段Google的"AI+软件+硬件",就是把Google助手装入每一个硬件产品中。

其次,这些产品,无论多么激动人心,暂时与中国用户无缘。

不过,Google在总结时也说:硬件业务才刚刚开始,我们志在长远未来。

最后还有一个官方1分钟视频回顾:

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2ypg8F7
RSS Feed

RSS5

IFTTT

2017年10月3日星期二

Waymo冰火两重天:无人出租车最快今秋推出,高管团队嫌隙严重

维金 千平 编译整理量子位 出品 | 公众号 QbitAI

我们离无人车(可能)只有一步之遥。

谷歌旗下无人车公司Waymo正准备推出无人驾驶汽车的商用共享出行服务,最快今年秋天发布。而且这些是完全无人出租车,将不会配备负责安全的人类司机。

与此同时,Waymo正在解决高级管理层的不合,这些影响了团队的士气。

嫌隙

消息人士表示,Waymo软件负责人、创始成员之一多尔戈夫(Dmitri Dolgov)曾私下批评公司CEO克拉夫西克(John Krafcik)的管理风格。多尔戈夫的不满包括:克拉夫西克缺乏对无人驾驶系统的了解,无法基于这样的了解去决定,如何推出商用服务。

多尔戈夫还批评,克拉夫西克在一些重要事项上与Alphabet两名联合创始人拉里·佩奇和谢尔盖·布林站在一边,例如过于激进的产品发布计划,以及去年的招聘冻结。

克拉夫西克于2015年秋季被任命为CEO。

上面这张图表显示了Waymo的高级管理层结构,以及多尔戈夫在其中的地位。

多尔戈夫是谷歌最初无人驾驶汽车项目"Chauffeur"的一部分,该项目最终发展成为了Waymo。另一方面,克拉夫西克曾是现代和福特的高管,接替了此前的项目负责人乌尔姆森(Chris Urmson)。乌尔姆森已经从谷歌离职,成立了一家与Waymo有竞争关系的公司。

自乌尔姆森离职后,多尔戈夫在公司内部扮演了更加活跃、更加公开的角色。他承担了更多职责,包括模拟(在数字环境中运行自动驾驶汽车软件,帮助"学习"和测试新软件),以及处理图像、雷达和汽车探测到的其他数据的"感知"系统。此外,他还负责一些与系统密切相关的硬件元件。

一名同事表示:"他是把这些东西凝聚在一起的粘合剂。"多名消息人士表示,过去一年中,Waymo有很多人离开,而许多员工留在公司目的只是为了和多尔戈夫一同工作。

让员工保持愉快非常重要。关于无人驾驶汽车的人才争夺很激烈。许多关键人才从成熟公司,例如Waymo、特斯拉、Uber和百度离职,成立了自己的无人驾驶公司。此外我们也看到了一些诉讼,确保这些人才不会把专利技术带到新公司。

没有迹象表明,多尔戈夫会因为对克拉夫西克的不满在短期内离职。多尔戈夫曾明确对同事表示,他会留在公司完成最终目标:成为首个在大众市场推出安全的自动驾驶出行服务的工程师,即使他与高级管理层存在分歧。

一些前同事和现在的同事表示,出生在俄罗斯的多尔戈夫是一名"严肃而平和"的领导者,有着"很高的忍耐力"。这意味着,他可以忍受技术和办公室政治的挑战。

实际上,Waymo聘请克拉夫西克是为了加速商用服务的推出,而不是让他成为技术领袖。为了更好地了解无人驾驶技术,今年早些时候,克拉夫西克将自己的办公桌搬到了工程师团队附近,而不是靠近业务和产品负责人。

尽管表面上看有些紧张,但在无人驾驶汽车的开发过程中,Waymo正处于领先地位。消息人士表示,Waymo最初的共享出行服务预计最快将于本月在凤凰城地区展开运营。

多尔戈夫的团队中包括一些长期伙伴,例如Andrew Chatham(他开发了软件基础平台,用于详细地图和汽车收集的其他数据)、Mike Montemerlo和Nathaniel Fairfield,他俩从事"运动规划"方面的工作,研究自动驾驶汽车如何规划和执行它们的行动。

争执

Waymo工程师团队和克拉夫西克之间的矛盾已经积累了一段时间。去年夏季,Waymo曾举行全体员工大会,讨论乌尔姆森的离职。

克拉夫西克需要回答员工匿名提交的问题,即为何他能比乌尔姆森更好地领导这方面的工作。他表示,他被聘请领导这支团队,且没有参与到谷歌创始人在公司外部寻找人选的决策中。乌尔姆森则没有对这篇报道置评。

消息人士称,克拉夫西克的加入是由于,Alphabet的创始人对于Chauffeur的发展不再抱有幻想。在招聘克拉夫西克时,谷歌的两名创始人设定的目标是,Chauffeur于2016年底推出商用服务。

然而工程团队的领导者怀疑,Waymo是否有这样的能力,尤其考虑到该公司并没有汽车去试验多尔戈夫开发的软件和自主设计的传感器。当时,谷歌正在与福特进行全面合作谈判,希望由福特来提供汽车。包括多尔戈夫在内的工程团队领导者均支持这一合作。

然而佩奇担心,合作的成本太高,而克拉夫西克也同意放弃这项合作,这导致Chauffeur花掉了更多时间。随后,Waymo团队与克莱斯勒达成了小规模的合作协议,在克莱斯勒的混合动力面包车上配置Chauffeur软件。

正如此次事件所表明的,克拉夫西克和多尔戈夫等工程师的矛盾实际上在于:拉里·佩奇,而不是克拉夫西克,才是Waymo的最终控制者。

Waymo的工程师和谷歌创始人之间还发生过许多其他争执,包括是否与Lyft和Uber等现有的共享出行服务合作。谷歌创始人希望推出不需要人工司机的自动驾驶共享出行平台。

最终,Waymo的领导者说服了谷歌创始人采取混合的模式,即人工司机是有必要的,能处理Waymo汽车无法处理的一些场景,例如长途出行,以及穿越Waymo地图尚未收入的私人道路。Waymo后来宣布,将与Lyft合作处理这些情况。

克拉夫西克

克拉夫西克随后自己招聘了一些工程师,包括今年从特斯拉硬件工程总监任上转投而来的Satish Jeyachandran。目前,Jeyachandran领导了一支Chauffeur资深工程师团队,开发激光雷达和其他对象探测传感器。

克拉夫西克还招聘了一些非技术领导者,协助领导公司的中层管理者,这些管理者大部分曾为乌尔姆森工作。克拉夫西克从Airbnb挖来了商业开发和战略负责人Shaun Stewart。考虑到Stewart在酒店行业的背景,这是个有趣的选择。据透露,除了安全性之外,自动驾驶汽车还应该带来更多不同,包括让乘客更舒适的车内体验。

Stewart的团队协助敲定了与租车公司安飞士的合作。安飞士已同意,在亚利桑那州帮助Waymo维护车队,包括车辆清洗等等。

另一个值得关注的关键人物是Robert Ellis。他领导了Waymo在底特律地区的办公室。Waymo的工程师在这里与克莱斯勒和其他潜在合作伙伴一同测试车辆。福特资深工程师Adam Frost目前负责Waymo与汽车厂商的技术合作,经常飞往底特律和其他地区。

而在Waymo推出打车服务之前,Dan Chu的产品团队关于"用户体验"还有更多工作要做,即用户如何与无人驾驶汽车互动,例如用户如何向车辆发信号,让车辆到达需要的位置。

左转

开头我们提过,Waymo可能很快就要推出正式商用的无人出租车。如果没能在这个秋天,或者今年的最后几个月发布,Waymo最迟2018年也会把完全无人出租车投入市场。

但这个野心勃勃的计划背后,还有很多现实层面的障碍。

比方说,左转。

据知情人士透露,在此前一年半的测试期间,Waymo的无人车在钱德勒及附近街道上,常常不得不终止左转,因为软件不够安全。特别是在没有左转专用信号灯的路口,这对不少人类司机来说都不是易事,更别提无人车。

搞定这些事对Waymo至关重要。目前美国路面上测试的无人车,包括Uber也在测试的无人出租车业务,都有人类司机坐在车上,以便在出现问题时及时接手。不过Waymo的想法是撤掉车里的人类司机。

所以Waymo建了一个指挥中心,监控人员坐在那里监控无人车,并在无人车感觉无能为力时提供帮助。如果监控人员没有立即作出反应,这些无人车就会停下来或者靠边等待,否则就会变成路上的交通障碍。

每次Waymo无人车的软件系统升级,也会带来不稳定因素。比方看似已经不错的左转,升级之后就完全变了,还得车上的人类司机接手,避免不安全的情况出现。其他还有诸如死路等挑战。

为了减少风险,Waymo的无人车基本上采用"爷爷式"的驾驶方式:慢慢开,避免风险。不过开得慢也不能解决左转的问题,所以有人提议限制左转。2010年的调查显示,左转引发了美国最多的撞车事故。

气象的影响也不容忽略,凤凰城地区还会出现沙尘暴、高温等天气情况。Waymo也在其他地区测试雨雪带来的影响。

对于上述种种,Waymo一名发言人表示,不会对传闻置评,"我们正全力专注于将自动驾驶技术推向市场"。

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2ymQvoa
RSS Feed

RSS5

IFTTT

Waymo冰火两重天:无人出租车最快今秋推出,高管团队嫌隙严重

维金 千平 编译整理量子位 出品 | 公众号 QbitAI

我们离无人车(可能)只有一步之遥。

谷歌旗下无人车公司Waymo正准备推出无人驾驶汽车的商用共享出行服务,最快今年秋天发布。而且这些是完全无人出租车,将不会配备负责安全的人类司机。

与此同时,Waymo正在解决高级管理层的不合,这些影响了团队的士气。

嫌隙

消息人士表示,Waymo软件负责人、创始成员之一多尔戈夫(Dmitri Dolgov)曾私下批评公司CEO克拉夫西克(John Krafcik)的管理风格。多尔戈夫的不满包括:克拉夫西克缺乏对无人驾驶系统的了解,无法基于这样的了解去决定,如何推出商用服务。

多尔戈夫还批评,克拉夫西克在一些重要事项上与Alphabet两名联合创始人拉里·佩奇和谢尔盖·布林站在一边,例如过于激进的产品发布计划,以及去年的招聘冻结。

克拉夫西克于2015年秋季被任命为CEO。

上面这张图表显示了Waymo的高级管理层结构,以及多尔戈夫在其中的地位。

多尔戈夫是谷歌最初无人驾驶汽车项目"Chauffeur"的一部分,该项目最终发展成为了Waymo。另一方面,克拉夫西克曾是现代和福特的高管,接替了此前的项目负责人乌尔姆森(Chris Urmson)。乌尔姆森已经从谷歌离职,成立了一家与Waymo有竞争关系的公司。

自乌尔姆森离职后,多尔戈夫在公司内部扮演了更加活跃、更加公开的角色。他承担了更多职责,包括模拟(在数字环境中运行自动驾驶汽车软件,帮助"学习"和测试新软件),以及处理图像、雷达和汽车探测到的其他数据的"感知"系统。此外,他还负责一些与系统密切相关的硬件元件。

一名同事表示:"他是把这些东西凝聚在一起的粘合剂。"多名消息人士表示,过去一年中,Waymo有很多人离开,而许多员工留在公司目的只是为了和多尔戈夫一同工作。

让员工保持愉快非常重要。关于无人驾驶汽车的人才争夺很激烈。许多关键人才从成熟公司,例如Waymo、特斯拉、Uber和百度离职,成立了自己的无人驾驶公司。此外我们也看到了一些诉讼,确保这些人才不会把专利技术带到新公司。

没有迹象表明,多尔戈夫会因为对克拉夫西克的不满在短期内离职。多尔戈夫曾明确对同事表示,他会留在公司完成最终目标:成为首个在大众市场推出安全的自动驾驶出行服务的工程师,即使他与高级管理层存在分歧。

一些前同事和现在的同事表示,出生在俄罗斯的多尔戈夫是一名"严肃而平和"的领导者,有着"很高的忍耐力"。这意味着,他可以忍受技术和办公室政治的挑战。

实际上,Waymo聘请克拉夫西克是为了加速商用服务的推出,而不是让他成为技术领袖。为了更好地了解无人驾驶技术,今年早些时候,克拉夫西克将自己的办公桌搬到了工程师团队附近,而不是靠近业务和产品负责人。

尽管表面上看有些紧张,但在无人驾驶汽车的开发过程中,Waymo正处于领先地位。消息人士表示,Waymo最初的共享出行服务预计最快将于本月在凤凰城地区展开运营。

多尔戈夫的团队中包括一些长期伙伴,例如Andrew Chatham(他开发了软件基础平台,用于详细地图和汽车收集的其他数据)、Mike Montemerlo和Nathaniel Fairfield,他俩从事"运动规划"方面的工作,研究自动驾驶汽车如何规划和执行它们的行动。

争执

Waymo工程师团队和克拉夫西克之间的矛盾已经积累了一段时间。去年夏季,Waymo曾举行全体员工大会,讨论乌尔姆森的离职。

克拉夫西克需要回答员工匿名提交的问题,即为何他能比乌尔姆森更好地领导这方面的工作。他表示,他被聘请领导这支团队,且没有参与到谷歌创始人在公司外部寻找人选的决策中。乌尔姆森则没有对这篇报道置评。

消息人士称,克拉夫西克的加入是由于,Alphabet的创始人对于Chauffeur的发展不再抱有幻想。在招聘克拉夫西克时,谷歌的两名创始人设定的目标是,Chauffeur于2016年底推出商用服务。

然而工程团队的领导者怀疑,Waymo是否有这样的能力,尤其考虑到该公司并没有汽车去试验多尔戈夫开发的软件和自主设计的传感器。当时,谷歌正在与福特进行全面合作谈判,希望由福特来提供汽车。包括多尔戈夫在内的工程团队领导者均支持这一合作。

然而佩奇担心,合作的成本太高,而克拉夫西克也同意放弃这项合作,这导致Chauffeur花掉了更多时间。随后,Waymo团队与克莱斯勒达成了小规模的合作协议,在克莱斯勒的混合动力面包车上配置Chauffeur软件。

正如此次事件所表明的,克拉夫西克和多尔戈夫等工程师的矛盾实际上在于:拉里·佩奇,而不是克拉夫西克,才是Waymo的最终控制者。

Waymo的工程师和谷歌创始人之间还发生过许多其他争执,包括是否与Lyft和Uber等现有的共享出行服务合作。谷歌创始人希望推出不需要人工司机的自动驾驶共享出行平台。

最终,Waymo的领导者说服了谷歌创始人采取混合的模式,即人工司机是有必要的,能处理Waymo汽车无法处理的一些场景,例如长途出行,以及穿越Waymo地图尚未收入的私人道路。Waymo后来宣布,将与Lyft合作处理这些情况。

克拉夫西克

克拉夫西克随后自己招聘了一些工程师,包括今年从特斯拉硬件工程总监任上转投而来的Satish Jeyachandran。目前,Jeyachandran领导了一支Chauffeur资深工程师团队,开发激光雷达和其他对象探测传感器。

克拉夫西克还招聘了一些非技术领导者,协助领导公司的中层管理者,这些管理者大部分曾为乌尔姆森工作。克拉夫西克从Airbnb挖来了商业开发和战略负责人Shaun Stewart。考虑到Stewart在酒店行业的背景,这是个有趣的选择。据透露,除了安全性之外,自动驾驶汽车还应该带来更多不同,包括让乘客更舒适的车内体验。

Stewart的团队协助敲定了与租车公司安飞士的合作。安飞士已同意,在亚利桑那州帮助Waymo维护车队,包括车辆清洗等等。

另一个值得关注的关键人物是Robert Ellis。他领导了Waymo在底特律地区的办公室。Waymo的工程师在这里与克莱斯勒和其他潜在合作伙伴一同测试车辆。福特资深工程师Adam Frost目前负责Waymo与汽车厂商的技术合作,经常飞往底特律和其他地区。

而在Waymo推出打车服务之前,Dan Chu的产品团队关于"用户体验"还有更多工作要做,即用户如何与无人驾驶汽车互动,例如用户如何向车辆发信号,让车辆到达需要的位置。

左转

开头我们提过,Waymo可能很快就要推出正式商用的无人出租车。如果没能在这个秋天,或者今年的最后几个月发布,Waymo最迟2018年也会把完全无人出租车投入市场。

但这个野心勃勃的计划背后,还有很多现实层面的障碍。

比方说,左转。

据知情人士透露,在此前一年半的测试期间,Waymo的无人车在钱德勒及附近街道上,常常不得不终止左转,因为软件不够安全。特别是在没有左转专用信号灯的路口,这对不少人类司机来说都不是易事,更别提无人车。

搞定这些事对Waymo至关重要。目前美国路面上测试的无人车,包括Uber也在测试的无人出租车业务,都有人类司机坐在车上,以便在出现问题时及时接手。不过Waymo的想法是撤掉车里的人类司机。

所以Waymo建了一个指挥中心,监控人员坐在那里监控无人车,并在无人车感觉无能为力时提供帮助。如果监控人员没有立即作出反应,这些无人车就会停下来或者靠边等待,否则就会变成路上的交通障碍。

每次Waymo无人车的软件系统升级,也会带来不稳定因素。比方看似已经不错的左转,升级之后就完全变了,还得车上的人类司机接手,避免不安全的情况出现。其他还有诸如死路等挑战。

为了减少风险,Waymo的无人车基本上采用"爷爷式"的驾驶方式:慢慢开,避免风险。不过开得慢也不能解决左转的问题,所以有人提议限制左转。2010年的调查显示,左转引发了美国最多的撞车事故。

气象的影响也不容忽略,凤凰城地区还会出现沙尘暴、高温等天气情况。Waymo也在其他地区测试雨雪带来的影响。

对于上述种种,Waymo一名发言人表示,不会对传闻置评,"我们正全力专注于将自动驾驶技术推向市场"。

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2ymQvoa
RSS Feed

RSS5

IFTTT

李航NSR论文:深度学习NLP的现有优势与未来挑战

近日,AI 技术大牛李航博士(已加入今日头条)在《国家科学评论》(National Science Review,NSR)上发表了一篇题为《Deep Learning for Natural Language Processing: Advantages and Challenges》的论文,扼要地探讨了深度学习 NLP 的当前现状与未来机遇。作者认为深度学习可通过与强化学习、推断等技术的结合,进一步扩展 NLP 的边界。


论文链接:http://ift.tt/2xfBdwo


1. 介绍


深度学习是指学习和利用「深度」人工神经网络比如深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)的机器学习技术。目前深度学习已成功应用于自然语言处理(NLP)并取得了重大进展。本论文对深度学习在 NLP 方面的最新进展做了总结,并进一步探讨了其优势与挑战。


我们认为 NLP 有五个主要任务:分类、匹配、翻译、结构化预测、与序贯决策过程。对于前四个任务,深度学习方法的表现优于或显著优于传统方法。


端到端训练与表征学习是深度学习的核心特征,这使其成为 NLP 的强大工具。但深度学习并非万能,它在对解决多轮对话等复杂任务异常关键的推断和决策上表现欠佳。此外,如何结合符号处理与神经处理、如何应对长尾现象等问题依然是深度学习 NLP 面临的挑战。


2. NLP 的进展


如上所述,我们认为 NLP 主要有五个任务:分类、匹配、翻译、结构化预测、与序贯决策过程。自然语言处理中的绝大多数问题皆可归入其中的一个,如表 1 所示。在这些任务中,单词、词组、语句、段落甚至文档通常被看作标记(字符串)序列而采取相似的处理,尽管它们的复杂度并不相同。事实上,语句是 NLP 中最常用的处理单元。


最近发现,深度学习有助于解决前四个任务,并成为解决这些问题的当前最佳技术(比如 [1-8])。


表 1:NLP 的五个主要任务


表 2:不同方法在 NLP 问题上的表现对比


表 2 表明在示例问题上深度学习的表现已超越传统方法。在所有的 NLP 问题中,机器翻译的进展尤其引人注目。神经机器翻译(使用深度学习的机器翻译)的表现显著优于传统的统计机器翻译。当前最佳的神经翻译系统采用了包含 RNN [4-6] 的序列到序列学习模型。


此外,深度学习首次使某些应用变成可能。比如,深度学习成功应用于图像检索(又叫 text to image),首先使用 CNN 把查询和图像转换成与 DNN 匹配的向量表征,然后计算查询和图像的相关性 [3]。深度学习还可用于基于生成的自然语言对话,该任务中给出一句话,系统可以自动生成回答,该模型使用序列到序列学习进行训练 [7]。


第五项任务中,序贯决策过程,如马尔科夫决策过程,是多轮对话的关键问题。但是,深度学习对该任务有何贡献尚未得到完全验证。


3. 优势和挑战


深度学习应用于自然语言处理时具备很多优势,也面临许多挑战,如表 3 所示。



表 3. 深度学习 NLP 的优势和挑战

3-1. 优势


我们认为端到端训练和表征学习真正使深度学习区别于传统的机器学习方法,使之成为自然语言处理的强大工具。


深度学习中通常可以执行端到端的训练。原因在于模型(深度神经网络)能够提供充足的可表征性,数据中的信息能够在模型中得到高效「编码」。比如,在神经机器翻译中,模型完全利用平行语料库自动构建而成,且通常不需要人工干预。与传统的统计机器翻译(特征工程是其关键)相比,这是一个明显的优势。


使用深度学习,数据可以有不同形式的表征,比如,文本和图像都可以作为真值向量被学习。这使之能够多模态执行信息处理。比如,在图像检索任务中,将查询(文本)与图像匹配并找到最相关的图像变得可行,因为所有这些都可以用向量来表征。


3-2. 挑战


深度学习还面临着更普遍的挑战,比如,缺乏理论基础和模型可解释性、需要大量数据和强大的计算资源。而 NLP 需要面对一些独特的挑战,即长尾挑战、无法直接处理符号以及有效进行推断和决策。


自然语言数据通常遵循幂律分布(power law distribution)。因此,词汇量随着数据规模的增加而增加。这意味着不管有多少训练数据,通常都会存在训练数据无法覆盖的情况。如何处理长尾问题对深度学习来说是一个巨大挑战。仅仅凭借深度学习解决该问题比较困难。


语言数据是自然符号数据,和深度学习通常使用的向量数据(真值向量)不同。目前的方法是,先将语言中的符号数据转换成向量数据,然后输入神经网络中,再把神经网络的输出转换成符号数据。事实上,自然语言处理的大量知识都是符号的形式,包括语言学知识(如语法)、词汇知识(如 WordNet)和世界知识(如 Wikipedia)。目前,深度学习方法尚未有效利用这些知识。符号表征易于解释和操作,而向量表征对歧义和噪声具有一定的鲁棒性。如何把符号数据和向量数据结合起来、如何利用二者的力量仍然是 NLP 领域一个有待解决的问题。


自然语言处理领域有很多复杂任务,这些任务可能无法仅使用深度学习来轻松完成。例如,多轮对话是一个非常复杂的过程,涉及语言理解、语言生成、对话管理、知识库访问和推断。对话管理可以正式作为序贯决策过程,其中强化学习发挥关键作用。很明显,把深度学习和强化学习结合起来可能有利于完成任务。


总之,深度学习 NLP 仍然面临许多待解决的挑战。深度学习与其他技术(强化学习、推断、知识)结合起来将会进一步扩展 NLP 的边界。 


参考文献


1. P Blunsom, E Grefenstette and N Kalchbrenner. Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, Baltimore USA, 655-65, 2014. 

2. B Hu, Z Lu and H Li et al. Advances in Neural Information Processing Systems 27, Montreal Canada, 2042-50, 2014. 

3. L Ma, Z Lu and L Shang et al., Proceedings of International Conference on Computer Vision, Santiago, Chile, 2623-31, 2015. 

4. K Cho, B Van Merriënboer and C Gulcehre et al. Proceedings of Conference on Empirical Methods in Natural Language Processing, Doha, Qatar, 1724-34, 2014.

5. D Bahdanau, K Cho and Y Bengio. Proceedings of the 3rd International Conference on Learning Representations, San Diago USA, 2015. 

6. Y Wu, M Schuster and Z Chen et al. CoRR, vol. abs/1609.08144, 2016. 

7. L Shang, Z Lu and H Li. ACL-IJCNLP'15, Proceedings of the 53th Annual Meeting of Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing, Beijing, China, 1577-86, 2015. 

8. D Chen and C D. Manning. Proceedings of Conference on Empirical Methods in Natural Language Processing, Doha, Qatar, 740-50, 2014.

]]> 原文: http://ift.tt/2xfstX5
RSS Feed

机器知心

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...