2018年5月8日星期二

从TPU3.0到DeepMind支持的Android P,谷歌I/O 2018的AI亮点全在这了

2018 年 5 月 8 日,一年一度的谷歌 I/O 开发者大会在美国加州山景城开幕。2016 年谷歌从移动优先到人工智能优先(AI-first),两年来我们从谷歌 I/O 看到了谷歌如何践行这一战略。在今日刚刚结束的 Keynote 中,机器学习依旧是整个大会的主旋律:谷歌发布了 TPU 3.0、Google Duplex,以及基于 AI 核心的新一代安卓操作系统 Android P,也介绍了自己在 News、Map、Lens 等众多产品中对 AI 与机器学习模型的应用。本文带你一览谷歌 I/O 2018 首日 keynote 的核心亮点。

在今天的 Keynote 中,谷歌 CEO 桑德尔·皮查伊等人介绍了谷歌一年来的多方面 AI 研究成果,例如深度学习医疗、TPU3.0、Google Duplex 等,也展示了 AI 如何全方位地融入了谷歌每一条产品线,从安卓到 Google Lens 和 Waymo。在本文中,机器之心对 Keynote 的核心内容进行了整理。

深度学习医疗

大会刚开始,昨天谷歌所有的 AI 研究合并出的 Google AI 发布了一篇博客,介绍谷歌在医疗领域的研究:

联合斯坦福医学院、加州大学旧金山分校 、芝加哥大学医学中心,谷歌今天在 Nature Partner Journals: Digital Medicine 上发布了一篇论文《Scalable and Accurate Deep Learning with Electronic Health Records》。

在此研究中,谷歌使用深度学习模型根据去识别的电子病历做出大量与病人相关的预测。重要的是,谷歌能够使用原始数据,不需要人工提取、清洁、转换病历中的相关变量。

在预测之前,深度学习模型读取早期到现在所有的数据点,然后学习对预测输出有帮助的数据。由于数据点数量巨大,谷歌基于循环神经网络与前馈网络开发出了一种新型的深度学习建模方法。

病人病历中的数据以时间线的形式展示

至于预测准确率(标准:1.00 为完美得分),如果病人就医时间较长,论文提出的模型预测得分为 0.86,而传统的 logistic 回归模型得分为 0.76。这一预测准确率已经相当惊人。

Looking to Listen:音频-视觉语音分离模型

而后,皮查伊介绍了谷歌博客不久前介绍的新型音频-视觉语音分离模型。

在论文《Looking to Listen at the Cocktail Party》中,谷歌提出了一种深度学习音频-视觉模型,用于将单个语音信号与背景噪声、其他人声等混合声音分离开来。这种方法用途广泛,从视频中的语音增强和识别、视频会议,到改进助听器,不一而足,尤其适用于有多个说话人的情景。

据介绍,这项技术的独特之处是结合了输入视频的听觉和视觉信号来分离语音。直观地讲,人的嘴的运动应当与该人说话时产生的声音相关联,这反过来又可以帮助识别音频的哪些部分对应于该人。视觉信号不仅在混合语音的情况下显著提高了语音分离质量(与仅仅使用音频的语音分离相比),它还将分离的干净语音轨道与视频中的可见说话者相关联。

在谷歌提出的方法中,输入是具有一个或多个说话人的视频,其中我们需要的语音受到其他说话人和/或背景噪声的干扰。输出是将输入音频轨道分解成的干净语音轨道,其中每个语音轨道来自视频中检测到的每一个人。

皮查伊还介绍了谷歌其他 NLP 应用,例如通过谷歌的键盘输入摩斯电码让语言障碍者重新获得表达能力、GMail 中利用语言模型与语境信息预测输入。

之后,皮查伊介绍了谷歌在计算机领域的一些研究成果与应用,包括医疗影像方面的研究,移动设备中应用的照片理解、抠图、自动上色和文档处理等。

TPU 3.0

去年,谷歌 I/0 公布了 TPU 2.0,且开放给了谷歌云客户。今天,皮查伊正式宣布 TPU 3.0 版本。

皮查伊介绍,TPU 3.0 版本功能强大,采用液冷系统,计算性能是 TPU 2.0 的 8 倍,可解决更多问题,让用户开发更大、更好、更准确的模型。更多有关 TPU 3.0 的信息也许会在之后放出。

Google Assitant 与 Google Duplex

集成谷歌人机交互研究的 Google Assistant 在今日的 keynote 中必然会亮相。Google Assitant 负责工程的副总裁 Scott Huffman 介绍了 Google Assitant 过去一年的成果,谷歌产品管理总监 Lilian Rincon 介绍了带有视觉体验的 Google Assistant 产品,且有数款产品将在今年 7 月份发布。

而后谷歌 CEO 桑德尔·皮查伊在 Keynote 中展示了语言交互的重要性,并正式介绍了一种进行自然语言对话的新技术 Google Duplex。这种技术旨在完成预约等特定任务,并使系统尽可能自然流畅地实现对话,使用户能像与人对话那样便捷。

这种自然的对话非常难以处理,因为用户可能会使用更加不正式或较长的句子,且语速和语调也会相应地增加。此外,在交互式对话中,同样的自然语句可能会根据语境有不同的意思,因为人类之间的自然对话总是根据语境尽可能省略一些语言。

为了解决这些问题,Duplex 基于循环神经网络TensorFlow Extended(TFX)在匿名电话会话数据集上进行训练。这种循环网络使用谷歌自动语音识别(ASR)技术的输出作为输入,包括语音的特征、会话历史和其它会话参数。谷歌会为每一个任务独立地训练一个理解模型,但所有任务都能利用共享的语料库。此外,谷歌还会使用 TFX 中的超参数优化方法优化模型的性能。

如下所示,输入语音将输入到 ASR 系统并获得输出,在结合 ASR 的输出与语境信息后可作为循环神经网络的输入。这一深度 RNN 最终将基于输入信息输出对应的响应文本,最后响应文本可传入文本转语音(TTS)系统完成对话。RNN 的输出与 TTS 系统对于生成流畅自然的语音非常重要,这也是 Duplex 系统关注的核心问题。

在 Duplex 系统的语音生成部分,谷歌结合了拼接式的 TTS 系统和合成式的 TTS 系统来控制语音语调,即结合了 Tacotron 和 WaveNet。

由于这样的系统引入了「嗯、额」等停顿语,系统生成的语音会显得更加的自然。当结合拼接式 TTS 引擎中大量不同的语音单元或添加合成式停顿时,这些引入的停顿语允许系统以自然的方式表示它还需要一些处理时间。

总的来说,Google Duplex 的这些结构与方法对生成更自然的对话与语音有非常大的帮助。目前虽然主要是针对特定领域中的语言交互,但确实提升了语音会话中的用户体验。

安卓以及闪现的 DeepMind

即将在今年 9 月迎来自己 10 岁生日的安卓也在 I/O 上宣布了新一代操作系统。继承 Android Oreo 工作的新版安卓系统被命名为 Android P。

「本次发布有三个主题,分别是智能(Intelligence)、简洁(Simplicity)与数字健康(Digital Wellbeing)。Android P 是我们『AI 位于操作系统核心』愿景的第一步,而 AI 也是『智能』主题的奠基石。」谷歌工程副总裁 Dave Burke 如是展开了他的演讲。

智能部分里首先介绍了两个功能,Adaptive Battery 自适应电池管理系统和 Adaptive Brightness 自适应亮度调节系统。

其中,Adaptive Battery 通过卷积神经网络来预测用户接下来会使用的应用程序,通过适应用户的使用模式将电池仅用于你接下来可能需要的应用程序中,这减少了 30% 的后台 CPU 唤醒。而 Adaptive Brightness 则不再单纯根据照明情况调节亮度,而是加上了用户喜好和所处环境因素。超过一半的测试用户减少了他们手动调节亮度条的频率。

事实上,这两个功能均来自之前一度被美媒质疑「烧钱还傲娇不干实事」的 DeepMindDeepMind 本次并没有直接在 I/O 露出,只是在博客上发表了一篇文章(https://deepmind.com/blog/deepmind-meet-android/),说明了 Android 的这两个新功能来自 DeepMind for Google 团队。

除此之外,Android P 也将去年发布的、准确率达到 60% 的「用户接下来可能使用哪个 App」预测更进一步,转而预测「用户接下来可能用什么 App 进行什么操作」,并直接在上滑菜单顶部呈现给用户。

Dave Burke 在介绍上述每一个功能时都着重强调了所有的预测均由在端上运行的机器学习模型完成,以确保用户隐私得到最大程度的保护。

除了将 AI 融入操作系统的优化之外,Android 还试图降低非机器学习背景的开发者使用相关技能的门槛:包括图片标注、文字识别、智能回复等一系列 AI 相关的 API 将以 ML Kit 的形式开放给开发者。

「你可以将 ML Kit 视作基于 TensorFlow Lite 提供的、为移动设备优化过的、随拿随用机器学习模型。」Dave Kurve 介绍说。而且,谷歌非常大方地同时对 iOS 系统开放了这一 API 集。

开发者今天就能在 Pixel 上实验 Android P Beta 的效果了。值得一提的是,除了 Pixel 之外,Android P Beta 还对其他 7 家手机生产厂商的旗舰机开放,其中有 4 家都来自中国,它们分别是小米、vivo、oppo 和一加。

无人驾驶

昨日,起源于斯坦福人工智能实验室的自动驾驶汽车初创公司 Drive.ai 于 7 日宣布,将与德克萨斯州的弗里斯科政府以及 Hall 集团进行合作,在德州落地首个无人出租车服务。而在今天的 Keynote 中,Waymo CEO John Krafcik 通过视频展示了居住在凤凰城的一些人参与其 EarlyRider 项目(即体验 Waymo 的自动驾驶技术)的场景。Krafcik 称 Waymo 将在今年于凤凰城开始 passenger-pickup 项目,凤凰城是第一站。

结语

一年一度的谷歌 I/O 开发者大会首日 Keynote 中的核心内容如上,相比于偏重机器学习技术的 2016 年与 2017 年,今年的内容更多关于 AI 的应用与产品。两年来,我们看到了谷歌如何践行 AI First 战略。接下来几天,机器之心将会继续报道谷歌 I/O 2018 的更多精彩内容。

]]> 原文: https://ift.tt/2wopa4R
RSS Feed

机器知心

IFTTT

少了AI First那类口号的谷歌I/O大会,似乎也少了行业风向标式的新意

「人们对有用信息的获取需求,与 20 年前谷歌成立时一样紧迫。」谷歌 CEO 桑德尔·皮查伊说,「但最重要的改变在于,我们组织信息和解决世界的复杂现实问题的能力,而这要归功于人工智能技术。」

在去年大会主题「Mobile first to AI first」之下,AI 是 I/O 的绝对主角,现场大约要听到上百次 AI 。今年,AI 不再是一个单独强调的方向,伴随 AI 技术深度渗透到谷歌旗下所有产品并逐步布局到云端向外输出,谷歌要让 AI 影响每个人。

「我们正处于计算的一个重要转折点,推动技术向前是 令人兴奋的。很明显,技术是可以是一种积极的力量,可以提高全世界数十亿人的生活质量。」桑德尔·皮查伊说。

不过,愿景之下,超过 7000 名开发者在现场所能听到可称为行业「风向标」的亮点却不算太多,反而越发感觉到巨头们在 AI 商业化上从产品到路径上的趋同。

显然,谷歌相当看好 AI 在医疗领域的应用

拿汉堡 emoji 调侃之后,桑德尔·皮查伊用医疗应用作为开场重点,某种程度上也呼应了他所提及推进 AI 技术最终要改变更多人的生活质量。

两年前,谷歌开发了一种深度学习算法,可以通过眼部医学影像检测到糖尿病引发视网膜病变的症状。今年二月,人工智能团队又成功利用机器学习来预测病人心脏病发作或中风的风险。

「而且准确度高得惊人。」桑德尔·皮查伊说。

他还介绍了一项最新研究,谷歌用深度学习模型分析识别健康档案的信息进行大量与病人相关的预测。技术上值得一提的是,谷歌能够使用原始数据,不需要人工提取、清洁、转换病历中的相关变量。

从实际应用来看,这相当于可以帮助医院进行更精确的病人管理,比如病人重新入院和住院时间等。

谷歌还把机器学习应用在莫尔斯密码设备上,残疾人士可以用算法键盘 Gboard 输入摩尔斯码重新获得语言交流的能力。

谷歌发了一款带屏的智能硬件…… 

两年前的谷歌I/O大会上宣布 Google Assistant 的愿景,今年它已经被部署在超过 5 亿台设备上,覆盖 5000 种不同设备,汽车品牌就有 40 多个。

而下一阶段的目标,则是进一步优化助手式服务,让它能在视觉能力辅助下用更自然的对话方式帮助用户完成更多事情。

桑德尔·皮查伊在 Keynote 中展示了语言交互的重要性,并正式介绍了一种进行自然语言对话的新技术 Google Duplex。这种技术旨在完成预约等特定任务,并使系统尽可能自然流畅地实现对话,使用户能像与人对话那样便捷。

比如,你不需要再重复说「Hey,Google」,它就能理解每一个后续需求;当你在和别人交谈时,它也会理解你的意思并作出相应的反应。Google Assistant 新增的6 种语音,背后也有 DeepMind 的身影。

2016 年 9 月,DeepMind 公布了其在语音合成领域的最新成果 WaveNet,这是一种原始音频波形深度生成模型,能够模仿人类的声音,生成的原始音频质量优于目前常用的语音合成方法。

不过,当时这个模型还只处于雏形阶段,对于消费级产品而言,模型的计算消耗量太大。经过 12 个月的努力,DeepMind 大大提升了模型运行的速度和质量并推出 WaveNet 的更新版本,可以在所有平台上生成美式英语和日语的 Google Assistant 语音。

为了让对话更自然,Google Assistant 还多了「multiple actions」的本事,意思即可以在同一句说话内容之内,可以包括多个要向 Google Assistant 下达的指令,像是「告诉我纽约市和旧金山的天气」或「关灯和打开微波炉」。

如何自然持续性对话,正是当下语音助手研究的难点和热点。

前不久,亚马逊推出了三个针对 Alexa 的改进方案(上下文转携、记忆提醒和搜索执行),并表示要在 5 月底之前实现这些功能。其中一个非常重要的功能就叫做「context carryover」(上下文转携):当语音请求从一个转向另外一个时,Alexa 可以「回忆」起之前的信息。也就是说,当用户连续问几个问题时,不需要在第二次发问时重复同一个信息点。

如今,亚马逊 Alexa 的 Skills 数量也已经超过 2.7 万项。而 Google Assistants 支持的 Actions 数量已经超过 100 万。

今天的大会上,Google Assistant 越发像一位真助理了,可以预约做头发、预定餐厅等任务。而在此之前,Google Assistant已经可以用语音来向好友收付款,还会订电影票。

在语言方面,Google Assistant 将会「学会」印度语、泰语、印尼语、丹麦语、挪威语、瑞典语及荷兰语等语言,并支持这些语言背景下的 Actions 开发工作;到今年年底 ,Google Assistant 支持的语言更是将会攀升至 30 多种。

最后,平常和语音助手对话一般只用 Hey Google 发命令,但这样会让小孩学不到有礼貌的语音习惯,怎么办呢?谷歌这次特别推出新功能,让语音助手理解对话中的敬语。

在 Google Assistant 的生态搭建上,基于家庭场景下的游戏、活动等应用方向,谷歌也开拓了很多内容合作伙伴,比如迪士尼。仅在过去两个月,家庭用户就听了超过 13 万小时的儿童故事。

而硬件上,当一个带屏幕的智能显示器出场,瞬间又「出戏」想起了亚马逊的 Echo  Show 和百度的小度在家。当然,谷歌并没有称它为智能音箱。

不过,在 Google 的设想里,智能显示器的使用场景也是在家里,用户主要通过语音来实现指令,比如找菜谱、控制智能家居设备(没错, 我们也看到了 Nest )、在 YouTube 上看直播、和家人进行远程视频通话等,当然其中也集成了所有谷歌在其他终端提供的基本服务。

据说,第一批产品会在 7 月份开始销售。

AI 继续渗透到谷歌产品

首当其冲的,自然是最近改版的GMail。

自从 2004 年 Gmail 上线以来,就只有在 2011 年时进行过一次大改版,之后虽然不时地增添一点小东西,但界面本质上并没有太大的变动,如果有新功能的话,Google 也是先在 Inbox 推出居多。

大会上,我们看到Gmail 又引入机器学习能力,带来了一个名为 Smart Compose (智能创作)的新功能。Gmail可以根据收件人、邮件主题、几个内容关键字等简单因素,直接替你写邮件。当你输入内容的时候,Gmail会智能预测你接下来要说的话,替你补完。如果觉得合适,你可以直接按下Tab键,根据建议内容完成一句话。它设置会根据邮件内容,建议会议或会面的地址、时间。该功能会在本月开放给Gmail用户。

除了 Google Assistant ,代表谷歌计算机视觉服务的 Google Lens 也公布了不断演进的新功能。

Google Lens 并不是一个硬件,而是一个可以根据图片或拍照识别出文本和物体的软件内部功能,能实时分析图像并迅速共享信息。

通过 Google Lens 的技术,系统可以判断相机镜头对着的影像信息内容。

比如对着传单上的 Email ,会自动在手机上显示问你是要创建联系人、传送信件或只是单纯复制文字。Google Lens 还可以判断艺术作品、唱片或者书本封面信息,快速帮你搜索出相关信息。刚到一个新城市旅游的 Google Lens 用户,只需要用手机摄像头环扫四周,就再也不怕地图导航指错路了。

今年大会展示的新技能里,还包括拍照片自动识别图片中的建筑物。

另外还有一个大多数中国用户都很熟悉的应用:拍下美美衣服,系统会自动弹出网购渠道。没错,这俨然是中国的「拍立淘」。

相册还自带调色功能,融合了很多专业图片处理软件的功能。但是,当Pichai 的PPT上显示出一张黑白老照片时,腾讯优图实验室可能会笑出来。

今年过年期间,腾讯优图实验室就推出过类似的应用:老照片还原技术。效果是这样的:

由于黑白照片已经完全损失了最重要的色彩信息,利用人工智能算法,可以在对照片进行图像分割,区分出标志性物体后,利用标志性物体的图像中的语义信息填充颜色。

比如,一个训练良好的神经网络模型,可以很轻易地识别出图像中的各种语义元素,如天空、草地、建筑、人脸等,而且神经网络本身也可以自动记忆,如天空为蓝色,草地为绿色,人脸为肤色等。

再次,当谷歌拿出使用机器学习算法的 Google News 应用之后,又出现了「今日头条」的既视感。系统推送的新闻内容具有三个主要特点:  首先,它会让你与自己关注的新闻同步;

其次,为了避免一叶障目的问题,系统会就你感兴趣的新闻提供多渠道、多角度的报道内容,并借用机器学习技术标注出新闻源的价值所在处。

最后,不断增加与你所喜爱的传统报业媒体合作。

Andriod P 来了

「 Android P 是 Google 将移动和人工智能整合的重要支柱。」Android 工程主管 Dave Burke 在发布Android P 时说道,「智能手机应该更聪明,它应该向用户学习并适应你。」

更聪明的一项改变是,用 AI 来管理电池寿命——自适应电池管理以及自适应亮度调节, DeepMind 提供了技术支持。

具体来说,自适应电池管理系统通过机器学习预测用户即将使用的应用程序,提供更可靠的电池体验。在应用程序被唤醒时, CPU 的耗电量能够降低 30%。

稍等一下,有没有感觉很熟悉?

没错,华为 Matte 10 内置麒麟 970 AI 芯片,而这款手机之所以能被称为「续航王」,也是因为它能根据用户使用习惯建模,利用机器学习预测用户使用行为,分配相应的手机资源。

而对于 DeepMind 来说,利用机器学习技术省电已经不是第一次了,阿尔法狗最初的商用方式就是给数据中心省电。但是,针对移动终端,这还是第一次。

自动驾驶?Waymo 没有带来多少惊喜

谷歌把最后亮相的时间交给了 Alphabet 旗下自动驾驶明星公司 Waymo,然而,也仅仅来了一次走过场式的演讲。

身着绿色上衣、牛仔裤的 Waymo CEO John Krafcik ,上台简单科普了公司的无人车「追梦」史,并再次预告了今年将上线自主品牌的共享出行服务 passenger-pickup ,凤凰城是第一站。很显然,这样的场合也不会刻意提及前些日子的事故。

通过视频展示,我们看到了凤凰城的部分居民参与其 EarlyRider 项目的场景,这是一个 Waymo 自动驾驶技术的体验项目。

另一位公司成员讲述了 Waymo 如何使用 Google 的机器学习算法让这位「司机」更聪明。

其中,一张图片让与会人士惊讶不已。

没有使用机器学习之前,汽车看到的雪景中的道路和汽车是这样的:

使用机器学习后,是这样的:

如今,Alphabet 已经成为一家年营收超过千亿的公司。上一季度财报显示,谷歌最赚钱的业务依旧是广告,尽管谷歌雄心勃勃地做自己的硬件。桑德尔·皮查伊曾于去年表示,接下来五年,硬件业务会成为公司财务的一大爆发亮点。

而这个突破点,或许就是 Waymo 。

]]> 原文: https://ift.tt/2FXwF2a
RSS Feed

机器知心

IFTTT

什么样的AI芯片初创公司才靠谱?北极光分享了它的投资「零失误」秘诀

站在 2016 年的时间节点,杨磊回首北极光在芯片领域的投资布局,谈到:「成立 11 年,我们一共投了十家公司,其中有三家上市,两家并购退出,其余五家全部融到了B轮或者C轮。换句话说,我们没有开错过一枪,零失误。」

杨磊是这家成立于 2005 年的投资机构的董事总经理,2010 年加入北极光前,他拥有10 余年的技术开发、公司战略和运营、以及投资经验。在他看来,北极光在芯片投资领域交出了这样的成绩单,并非出于偶然的好运气。

「做通用芯片的话,我们很难干过英伟达。」杨磊说,「要和英伟达、英特尔这样的企业竞争,我们必须要选择另外一条道路,把应用吃得非常深,并针对应用构建硬件。」

因此,北极光的每一个被投企业都是从一个细分的角度进行切入,例如专注于 IoT 无线射频的 BlueX,专注传感器的 Cista、镭神智能,专注处理器的 Spreadtrum、OURS,专注 DSA(Domain Specific Architecture)的登临、黑芝麻科技、亿智科技等,专注存储的 Crossbar, 以及专注音频前端处理的 GMEMS。

五月初的一个下午,在北京华贸顶层能够俯瞰全城的北极光办公室里,杨磊和北极光的芯片投资团队同我们聊了聊投资这十支团队背后的逻辑。

只投行老兵

「今天的 AI 芯片产业里有一个怪象。」杨磊说:「几年前开始,有一些企业进入这一领域,我认为他们是非常有前瞻性的,但这些公司大多是学院派。」

杨磊曾是学院派,2000 年他读博士的时候,曾进行过芯片设计。「当时我博士毕业,只需要一颗器件能用就可以毕业。但是真正要做产品的话,良率需要达到95%以上,这是很难的。因为我以前也做过很多研发,所以对学院派一点也不迷信。」他说

他认为,学院派创业者只能带动起二流的产业人,因为顶级的产业人会亲自独立操盘,胜算大很多。「我们看到现在很多 AI 芯片公司已经达到了一百人或者以上的规模,也开了发布会,但是发布会过后问卖了多少颗,就没声了。」杨磊说。

「这些公司在很早期的时候我们都有接触到,但是都没有投。」与杨磊的观察相对应的,北极光的十家被投企业全部来自产业,大多拥有核心 IP,团队经历过半导体领域的几个起伏周期,很多都有创业成功经验,属于二次创业。

「芯片领域,时间的积累非常重要,我非常崇尚一万小时的原则。」北极光投资经理赵顾说,在加入北极光之前,他曾是 Intel 人工智能中国区商务负责人,有逾 14 年的芯片研发管理、运营以及市场销售经验。

赵顾算了一笔账,一个有经验有能力的芯片工程师,在产业至少需要五年的培养周期、大概几百万人民币量级的投入。如果一个学院派团队有一百人,那就意味着几个亿的学费成本。

「从墨菲定律的角度看,学院派创业,这个学费是必须要付的。」赵顾说,「这也是我认可北极光投资理念的原因,投资成建制公司,在他们过往的经历中,学费已经付过了。」

冯诺伊曼架构将不再适用

在 AI 芯片大热的今天,北极光的着眼点并非 AI 芯片本身,而是计算架构的变革。曾经不论是个人计算机还是云服务器,基础都是 Intel 的 x86 架构。在 AI 时代,底层基础已经从 CPU 转换成 GPU,并即将进化为例如 TPU 的其他形态。

「底层变了,整个生态都会发生巨大的改变。」杨磊说,「就像是多米诺骨牌一样,一个倒了一连串的东西都会发生变化,所以我花很长时间去思考,这些变革会在什么地方发生。」

首先,杨磊认为,虽然当前 AI 计算主要依赖英伟达的 GPU,但未来 2-3 年,我们能够看到一些其他的企业跑进来。他看到,虽然英伟达芯片的灵活性无与伦比,但同时也存在功耗较高的问题。谷歌的 TPU 虽然是针对 AI 任务研发,但在外界看来,太难用,太硬了。

「真正的机会在这两个极端之间。」杨磊说,「要找到一个平衡态,但这个平衡态到底在哪个位置,很少有团队能想清楚。」

在北极光看来,这个「平衡态」并不单单是计算的「平衡态」,也是计算与存储结合的「平衡态」。自计算机诞生以来产业界就在遵循的冯诺伊曼架构在未来可能会被下一代人工智能的计算方式所颠覆。

「今天的芯片一部分做处理,一部分做存储,但是我们人类的大脑不是这样划分的。在生物大脑中,计算和存储是合二为一的。」杨磊说,「我们的一家被投企业在这方面已经有很多的思考。」

云、边缘、端、感器

「是不是未来只有云和端?」杨磊抛出了一个问题。「我们的观点:不是的。」

北极光认为,出于响应时间、效率和安全的考虑,未来一定会有一些存储和计算放在边缘。任何一家医院就是一个数据中心,任何一辆车也是一个数据中心,甚至任何一个家庭都是一个数据中心,也就是说,边缘将迎来翻天覆地的变革。

另外,北极光认为,在未来,并非所有的终端设备都会变得智能,而是会呈两极分化的态势——一类非常简单,而另一类非常智能。

简单的芯片只需具备连接、简单的计算以及存储几个基本功能,北极光在这一领域布局了一家公司,并推出「芯片即模组」概念。也就是说,今天模组上需要很多芯片才能完成的任务,在未来单一芯片上就能完成,且这颗芯片具备成本低、功耗低,体积小的特点。

而智能的芯片涵盖图像和声音两种能力,北极光在这两个领域也都有相应的布局。

在此基础上,北极光认为传感器将产生非常重要的价值,在图像传感器、Lidar 等领域都有相关投资。

AI 芯片,「芯片」的比重更大

「大家在谈 AI 芯片的时候,更多的谈的是 AI,但我认为芯片的比重更大。」赵顾说。北极光认为,芯片的生产需要实践与经验的积累,存在较高门槛。

「难点在哪?芯片是一个是产业链很长,流程复杂的严谨的工业,任何一个环节出现短板都不能达到预期产品和商业目标。有一些公司在算法红利逐渐消失之后,又开始找新的话题,想要通过芯片的方式变现,实际上没有那么简单。」赵顾说。

对于现阶段一些算法公司着手自研芯片的现象,北极光认为,算法公司与芯片公司合作将是更可取的方式。

]]> 原文: https://ift.tt/2IpJLud
RSS Feed

机器知心

IFTTT

一文看尽Google I/O大会:AI打电话以假乱真,TPU 3.0正式发布

安妮 李根 发自 山景城 量子位 报道 | 公众号 QbitAI

今天凌晨,Google I/O 2018大会拉开帷幕。

开场一句Make good things together,然后就向全世界展示了AI将会带来的美好世界,2小时内,黑科技亮眼,情怀满分。

具体什么情况?量子位带你一文打尽。

开场

这次的核心串讲人还是Google CEO皮猜。

他说今年有7000人来到现场,见证AI带来的焕然新机,也会看到AI正在带来的巨大变革和机遇。

当然,Facebook事件当前,皮猜也谈到了AI和隐私、技术和价值观的看法。他认为技术更核心的是正能量,但在隐私和道德等层面,也需要谨慎前行,而Google对此深怀责任感。

比如在印度,Google的医疗AI正在进行视网膜筛查心脏病和糖尿病,可以解决医疗资源不公的问题。而同样还是AI加持,Gboard(谷歌输入法)能够让使用摩斯码设备进行交流的残障人士更好生活。

Google还把使用摩斯码设备进行交流的残障人士请到现场,于是会场掌声雷动,持续许久。

不过,这只是Google情怀开胃菜,新品新动作的正餐端上,每一个都藏着AI对于世界的热爱。

我们一款一款看。

首先介绍的是,AI对于Google几款核心产品的变革。

Gmail:脑补回复

可以更加智能化写邮件,运用机器学习可以在你键入时实时推荐"你可能会用"的短语,让你只要不断点击确认键就行。

这个功能被称为"Smart Compose",5月末正式向全体用户上线。

Google Photos:智能P图

如今,每一天有超过50亿张的照片在Google相册中被查看。

而Google希望用AI带来的全新功能,让照片查看更简单。

一方面,识别和分享。可以帮你归类婚礼等活动照片,通过Smart Actions功能圈出好友更方便分享,以及把文件照片直接变成PDF扫描文件,让你更方便阅读。

另一方面,智能P图。利用AI分割图像,不仅能修复过度曝光或曝光不足的照片,还可以对老照片\黑白照片进行色彩还原。

这自然不是一个轻轻松松的工作,也是计算力的霸气外露,所以皮猜顺便表示:这是Google使用了特殊定制设计的机器学习芯片的结果。

即TPU。

TPU 3.0:比上一代强悍8倍

现在正式推出TPU 3.0,相比去年发布的2.0版本,性能提升8倍,高达100 petaflops,而且由于芯片太强大,Google第一次引入液体冷却方法——对于希望为机器学习创建定制硬件的公司来说,散热越来越成为一个难题。

皮猜同时强调,强大的TPU是Google AI更多完美使用的关键。

但谁才是Google AI最核心的应用?Google助手。

Google助手打Call真假难辨

新版本的Google助手亮点不少。

首先是"声音",采用了DeepMind(在I/O上被cue不多见)的Wavenet技术,可以提供6种很自然的"人声",并且音色之完美,已经可以以假乱真。

其次是Google助手搭载量。

现在已经有5亿台设备接入了Google助手,支持30多种语言,进入了80多个国家和地区——但中国区域依然空白。

不过现场演示的第三方设备则来自中国,一台联想的带屏智能音箱,7月就会发售。

第三是Google助手最重要的应用设备——手机。

新版本更新后,用户就可以利用Google助手订外卖,不过是到店自取——这一点中国人民哪会大惊小怪。

值得一提的是,这其中也会打通Google助手+Google 地图。所以Google的思路再明显不过:让所有Google软硬件产品都有Google助手加持。

此外,Google助手将有更多视觉感知能力。

最后,最大惊喜来自Google助手的新能力:打Call!

比如打电话到美发沙龙。AI那声"嗯哼"笑翻全场。

比如你可以通过Google助手预约订座——没错,它会直接打电话到餐厅,然后与餐厅工作人员进行多轮对话,更恐怖的是,对面可能完全分不清到底是人还是AI。

现场演示也将本次I/O带入一个小高潮。

令人感慨的是,互联网时代的名句是"电脑后不知是人是狗",但AI降世,未来给你打电话的似乎也难辨是人还是AI。

当然,餐厅\服务组织也能用这个功能接听电话,可以省去不少人力成本。

(但求AI拨打的骚扰\营销电话晚一些到来……)

目前,这项功能还在继续开发中。

Google News:无死角式AI报道

下一个登场的是Google News。其更新可用个5字来形容:懂你,更懂你。

新推出的"For You"栏目将利用机器学习技术,更好了解用户行为,每次将为用户推荐5个可能感兴趣的故事。

Google还推出一种全新的视觉格式叫做Newscasts,利用自然语言理解技术为用户推荐单一主题的文章和视频。汇集不同的新闻源,帮你找到最全面的信息。

若用户还想深入到一个特定话题,那么新推出的"Full Coverage"(全覆盖)功能可以帮你看到与这个事件相关的各种信息,包括不同来源的文章、视频、评论评论甚至相关的其他连锁信息。

简单来说,GoogleAI学会了自己创造新闻专题,堪称360度无死角报道~

Android P:为电池增寿、防沉迷

Google News之后,下一代安卓系统来了,代号Android P。

不出所料,Android P中还是融入了AI技术。

那么,AI到底体现在了哪里?可以说相当有趣。

拯救手机没电一族,Google与DeepMind合作,正在研究自适应电池,用AI增加电池寿命

AI将监控你手机的电池消耗情况,并将关闭你暂时没有接触过的应用程序。"它还会根据你的习惯调整你手机的亮度,Google数据显示,Android P系统在唤醒应用程序时,平均会减少30%的CPU使用量。

此外,Android P还带来了全新的交互形式,提出了"Action"(动作)和"Slices"(切片)的新概念。现在,在Android P的搜索可以做到事半功倍,比如当你想找到Lyft应用时,可以直接显示应用程序,而无需在不同的应用程序之间进行切换。

用过安卓的你肯定记得之前系统下像三颗纽扣版的导航,在Android P中,这样的操作系统界面将和我们彻底说再见。

Android P的交互界面和iPhone X类似,通过手势进入不同的界面和功能。拥有一个全新样貌的指示板,显示你的玩手机的"活跃指数"。在App上耗时如何、解锁几次、收到多少通知……你的私人防手机沉迷小助手已经上线。

Android P将于今年夏天晚些时候面市,但今天的公开测试版可以从即将到来的1加6、已经到来的小米MIX 2S、OPPO R15 Pro、Vivo X21及Google、Essential、索尼、诺基亚等几款智能手机中抢先体验一把。

Dashboard:解救手机焦虑症

Android P中还有重点推出的Dashboard功能。

Google想通过这个功能,让用户能更"健康"使用智能手机,关注所谓"数字化健康"问题。

主讲人Sameer说,因为智能手机太方便,以致于休假时都要被不断碎片化打断。

所以在安卓 P 版本中,首先会推出Dashboard,可以让你更好知晓:智能手机的时间都去哪儿了。

你可以查看每个App的应用时间,以及它们到底给你发送了多少通知。

同时,还能设置刷YouTube和Twitter的时长,到时间就变灰。Wind Down。

最后,现在还推出了一个名为"Shush"("嘘")的新玩法,只要把手机背面向上扣在桌上,手机就会自动进入"勿扰"模式。

这部分演示时,现场多次响起了共鸣掌声,当然也有一些情怀的因素,毕竟在更多App开发者想方设法留住、消磨你更多时间的时候,Google却希望你能在数字化时代同样健康生活,而且Google也强调:数字福祉,将成Google未来的长期主题。

更关键的是,这种福利这次也与中国用户有关。即将推出的安卓 P Beta测试版,全球7家手机厂商中,中国真真占据"半壁江山":小米、一加、OPPO和vivo都成为了首批合作机型。

Google地图:路痴福音

接下来登场的是Google地图,毫无疑问依然由AI驱动。

先介绍了最近进展,比如绘制并覆盖了220个国家和地区,累计让10亿用户通过Google地图在全球各地旅行。

但是现在,AI驱动之后,Google可以直接使用AI和卫星图像结合的方式,将更多商户和新地址添加到地图中,这对于很多发展中国家都很重要。

所以AI也会进一步带来地图使用的变革,之前是告诉你"在哪儿",未来可以更多帮助你"去那儿"。

可以直接通过Google地图搜索"附近营业的串店",总之就是帮助你发现和体验身边的世界。

当然,AI也会带来个性化推荐,通过大数据挖掘分析(比如你的音乐喜好、常去路线)等给你推荐美食店之类的,该功能可以说是"Google想让你长肉"。

然而作为Google这样的企业,一方面思考让用户更方便,另一方面也尝试让商家效率更高,比如通过全网数据挖掘,更快更新中小企业信息、营业时间、服务方式等,节约这些组织的时间。

不过Google地图的AI加持,还没完。

相机:打通虚拟世界和现实世界

利用AI,Google地图和相机还实现了打通。

直接与Google街景结合,打通虚拟和现实,堪称路痴福利,把AR应用到了相机中,打开相机,就能AR指方向——你妈再也不用担心你走错了。

类似应用之前最核心的是Google Lens,一款拍照搜索的App。

现在,拍照翻译(拍菜单)、拍照购物(类似拍立淘),以及拍图识别文字(类似OCR)都会在数周后发布的新版本中上线。

而且!目前只在Google Pixel手机中的Lens,下一步将进入更多安卓智能机中,比如小米、一加、TCL。

总之,Google利用AI技术,带来了虚拟世界和现实世界的新连接方式,并且能够帮助解决更多现实问题。

OMT:Waymo进展

最后,今天还有"乱入"的Waymo。

作为同属Alphabet的Google兄弟公司,Waymo首次在I/O大会上登台介绍进展颇有其他意味。

Waymo CEO John Krafcik没说啥新进展。

首先,今年晚些时候,会在凤凰城地区推出Waymo无人驾驶出租车。"Waymo不是在造一辆更好的车,而是建设一个更好的司机。"

其次,Waymo接下来的路,还将是合作共赢模式。Waymo打算与许多不同的公司合作,而不会仅仅局限于某一家车厂。

跟开发者相关的是,目前机器学习技术在Waymo无人车设计中挑起大梁,将检测行人的错误率降低到之前技术的百分之一,甚至连穿着恐龙服饰的人都能识别出来了。

此外,Krafcik表示,深度学习技术是帮助Waymo走上L5级自动驾驶的重中之重,目前,在无人车的感知和预测方面起到了重要作用。还展示了如何应付下雪天。

最后,Krafcik交出了一份Waymo无人车测试成绩单:

迄今为止,Waymo已经在公共道路上行驶了超过600万英里,在模拟中行驶了超过50亿英里。目前,Waymo的模拟还没有停止,还在持续测试恶劣天气中的无人车表现。目前,每天接受测试的Waymo无人车,大约为2.5万辆。

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2HZrNiQ
RSS Feed

RSS5

IFTTT

M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」-InfoQ每周精要No.900

「每周精要」 NO. 900 2025/11/01 头条 HEADLINE M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」 精选 SELECTED a16z 将 3000 万开发者标价 3 万亿 网友:几个初创公司 + 大模型就...