2018年2月1日星期四

自动选模型+调参:谷歌AutoML背后的技术解析


罗马不是一天建成的。AutoML 并非一蹴而就,而是 Google 的研究者在过去几年不断思考中产生的理论与实践结合的完美产物。下图是 Google 的 AutoML 探索之路。

 



人工网络结构搜索(Inception-ResNet 与 Inception V4)


Alexnet 在 IMAGENET 取得冠军之后,Google 意识到了深度学习是未来的趋势,于是投入巨资进行神经网络的研究。从 Deepmind 被收购,Hinton 加入 Google,Tensorflow 的开源中可见 Google 对于 Deep Learning 的重视与远见。Google 在不断的调参数中发现了著名的 Inception 网络,并且结合 ReNet,发现了 Inception-ResNet,V4 和 Xception。这些发现让 Google 注意到了神经网络结构会对结构产生巨大影响,但是找到最优的结构需要耗费大量的人力和物力,并且对于一个新的数据集还需要投入同样的资源搜索合适的结构,这样的人工搜索是不能够 scalable 的。Inception-ResNet 的网络结构请参考论文:https://arxiv.org/pdf/1602.07261.pdf。Inception 系列网络跟 ResNet 的结果比较。




神经网络搜索初探:Neural Architecture Search with Reinforcement Learning(ICLR 2017 Best Paper)


为了增加网络结构搜索的 scalability,Google Residency Program 的成员 Barrret Zoph 在 Quoc Le 的带领下开始了神经网络自动调参的尝试,Neural Architecture Search with Reinforcement Learning 就是对这一工作的总结。该论文获得了 ICLR 2017 的 Best Paper。Barret Zoph 的工作成功在 CIFAR 和 PTB 上面搜索到了 state-of-the-art 的 CNN 和 LSTM 结构,最优 CNN 与 LSTM 结构对比如下:




Barret Zoph 使用强化学习进行网络结构搜索,网络框架图如下图:

 



Controller 是由 RNN 构成能够产生每层网络的 Kernel 大小和 skip connection 的连接,产生了网络结构之后,使用网络结构的准确率作为 Reward function。Controller 会根据 reward function 的反馈进行网络结构调节,最后会得到最优的网络结构。Controller 生成网络结构预测如下图:

 



本篇论文会对 controller 预测的网络进行 SGD 学习,网络收敛之后的准确率为 Reward,然后使用 reinforcement learning 的 policy gradient 进行 controller 权值更新,policy gradient 公式如下:

 



期望值用下面的公式进行近似:




为了保证训练稳定,引入了 baseline,公式如下:

 



为了保证收敛速度,作者引入了 asynchronous 权值更新,在每个 GPU 中分配多个网络结构进行训练,跟 asynchronous reinforcement learning 的 idea 类似。改论文的 distribution 结构如下图:

 



本篇论文能够避免手动调参数,但是得到网络搜索需要 800GPU 搜索几个月的时间,最近 Google 使用 P100 可以在一周左右训练出模型,本论文仅仅在 CIFAR 上面进行实验,在大规模数据集 IMAGENET 上面的使用受限。


Large Scale Evolution of Image Classifiers(ICML 2017)


本篇论文通过 large scale evolution 的办法来搜索最优的神经网络,由于本人能力有限,我们不对这篇论文进行技术解析。该论文的结构搜索过程如下图:

 



有趣的现象是,evolution 搜索偏向于没有 skip connection 的神经网络。通过 evolution 办法搜索到的神经网络比 ResNet 结果好,但是低于 DenseNet,如下图:

 



神经网络搜索技术实用之路探索


为了让结构搜索的工作能够实用,Google 的研究者从 progressive Search,Transferable architecture 和 Bayesian 的角度进行探索,并且取得了进展。


Progressive Neural Architecture Search(PNAS)


本篇论文提出了通过 progressive 的办法进行网络搜索,会比 RL 方法快 2 倍,比 evolution 方法快 5 倍。


与之前的方法不同,本篇论文是在一个网络的基础上面加上新的 cell,然后使用类似与 A*搜索(Branch and Bound)的办法,搜索到最优的网络结构。Progressive 方法示意图如下:

 



PNAS 所使用的 Cell 结构如下:

 



Learning Transferable Architecture for Scalable Image Recognition


本篇论文是集大成者,Barret Zoph 在之前全部技术的基础上面,成功地将自动结构搜索在 IMAEGNET,COCO 等实用性的物体分类和检测任务上面成功运用。结果太 AMAZING 啦。竟然超过了 ResNet-FPN,COCO 物体检测结果如下:

 




Barret Zoph 首先在 CIFAR 上面使用之前的方法搜索出最优 cell,然后将 cell 重复的运用在 IMAGNET 上面(真的就是这么简单有效 >_<)。最优单个 cell 的结构如下图:

 



可能 AutoML 用的就是这种技术吧。


总结


Google 在大规模的调参中发现了手动调参不能够适应大数据时代的需求。于是进行从 reinforcement learning 和 evolution 两个角度进行了自动调参的初探。为了改进网络结构搜索的时间,Google 提出了 Progressive Search 和 Transferable Architecture 的办法。从中我们可以感受到 Google 一步一个脚印的做事方法,希望 AI 公司和个人都能够从中获得一些收益 >_<。

]]> 原文: http://ift.tt/2nvZegK
RSS Feed

机器知心

IFTTT

全力押注AI的谷歌,日子也并不好过

允中 发自 凹非寺量子位 出品 | 公众号 QbitAI

20年了,谷歌终于进入千亿美元俱乐部。

今早谷歌母公司Alphabet(股票代码:GOOGL)发布的最新财报显示,2017年这家公司全年收入达到1100亿美元,而2016年这个数字约为900亿美元。

千亿美元什么概念?

谷歌去年的收入,是社交巨头Facebook同年收入的2.7倍。同样刚发财报的搜狐,去年总收入为18.6亿美元。这么一看,差距还是相当明显。

过去一年,谷歌在各个场合不断强调"AI First",全力押注人工智能。而且谷歌也的确在人工智能方面独领风骚。理想丰满,但现实也很骨感。

现在的谷歌,日子并不算特别好过。

其实,千亿美元这个门槛,亚马逊2015年就已经迈过了。还有更狠的,苹果公司2011年就已经突破了,现在差不多一个季度的收入,就已接近千亿美元。

而且谷歌现在本质上仍是那个主要依靠广告的公司。千亿美元的营收中,九成以上都是广告业务带来的收入。广告收入是谷歌的根基。

去年第四季度,Alphabet营收增长至259亿美元,但是流量获取成本(TAC)增长的更快,达到64.5亿美元同比上涨33%。TAC主要付给手机、浏览器厂商。

也就是说,TAC已经占到谷歌广告收入的24%。同期,谷歌广告的平均每点击成本比去年同期下降14%,比上一季度下降6%。

谷歌面临着流量越来越贵的问题。有分析指出,搜索已经转移到移动设备,而搜索广告价格较低,但流量获取成本不断攀升,这成为谷歌无法回避的挑战。

广告和搜索之外的AI,能不能改变谷歌?

至少目前不能。谷歌在其他领域的布局,例如无人车公司Waymo、智能家居公司Nest、互联网气球等,这些听起来酷炫的业务,想想就知道是不赚钱的。

当然这些业务去年给谷歌也贡献了4亿美元营收,比前年的2.6亿美元有所进步。总体上带来的亏损是9亿多美元。都是成本啊,同学们。

不过值得注意的是,Waymo其实进展速度还挺快。

谷歌预计今年晚些时候,将推出无人出租车的服务。这是一个想象空间非常大的市场,当然谷歌的竞争对手也不弱,包括Waymo打官司的对象Uber。

更直接的好消息是,谷歌云的业绩增长还算不错。云计算平台和工作App,每年能带来40亿美元的收入。但谷歌云的实际业绩,与亚马逊相比,还有数量级上的差距。

亚马逊第四季度云计算业务收入51亿美元,谷歌云据说一个季度的收入已经可以超过10亿美元。虽然仍然落后亚马逊,但确实是巨大的进步。

除了云,谷歌的Pixel手机、智能音箱等硬件设备,虽然也提升了营销费用。但与苹果公司相比,谷歌落后的距离已经不值得再比较了。

总结一下,Alphabet第四季度净亏损30亿美元,去年同期是净赚53亿美元。

受到财报影响,Alphabet的股价盘后出现下跌。

还有一事,施密特此前宣布卸任后,Alphabet终于迎来了新的董事长:斯坦福前任校长John Hennessy。

今天,亚马逊和苹果也发布了财报。

量子位把主要数据列在下面。

亚马逊第四季度营收为604.53亿美元,净利润18.56亿美元;全年营收1779亿美元,净利润30亿美元。

对于(很可能)还不赚钱的业务——Alexa,亚马逊很看重,在电话会议里提了19次,成绩也相当不错。Alexa目前已经有3万来自外部开发人员的"技能",可以控制1200个品牌的4000多种设备。

第四季度对于苹果来说是2018财年第一财季,这个季度他们的净营收是882.93亿美元,净利润200.65亿美元。

不愧是苹果~

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2rZIe7l
RSS Feed

RSS5

IFTTT

全力押注AI的谷歌,日子也并不好过

允中 发自 凹非寺量子位 出品 | 公众号 QbitAI

20年了,谷歌终于进入千亿美元俱乐部。

今早谷歌母公司Alphabet(股票代码:GOOGL)发布的最新财报显示,2017年这家公司全年收入达到1100亿美元,而2016年这个数字约为900亿美元。

千亿美元什么概念?

谷歌去年的收入,是社交巨头Facebook同年收入的2.7倍。同样刚发财报的搜狐,去年总收入为18.6亿美元。这么一看,差距还是相当明显。

过去一年,谷歌在各个场合不断强调"AI First",全力押注人工智能。而且谷歌也的确在人工智能方面独领风骚。理想丰满,但现实也很骨感。

现在的谷歌,日子并不算特别好过。

其实,千亿美元这个门槛,亚马逊2015年就已经迈过了。还有更狠的,苹果公司2011年就已经突破了,现在差不多一个季度的收入,就已接近千亿美元。

而且谷歌现在本质上仍是那个主要依靠广告的公司。千亿美元的营收中,九成以上都是广告业务带来的收入。广告收入是谷歌的根基。

去年第四季度,Alphabet营收增长至259亿美元,但是流量获取成本(TAC)增长的更快,达到64.5亿美元同比上涨33%。TAC主要付给手机、浏览器厂商。

也就是说,TAC已经占到谷歌广告收入的24%。同期,谷歌广告的平均每点击成本比去年同期下降14%,比上一季度下降6%。

谷歌面临着流量越来越贵的问题。有分析指出,搜索已经转移到移动设备,而搜索广告价格较低,但流量获取成本不断攀升,这成为谷歌无法回避的挑战。

广告和搜索之外的AI,能不能改变谷歌?

至少目前不能。谷歌在其他领域的布局,例如无人车公司Waymo、智能家居公司Nest、互联网气球等,这些听起来酷炫的业务,想想就知道是不赚钱的。

当然这些业务去年给谷歌也贡献了4亿美元营收,比前年的2.6亿美元有所进步。总体上带来的亏损是9亿多美元。都是成本啊,同学们。

不过值得注意的是,Waymo其实进展速度还挺快。

谷歌预计今年晚些时候,将推出无人出租车的服务。这是一个想象空间非常大的市场,当然谷歌的竞争对手也不弱,包括Waymo打官司的对象Uber。

更直接的好消息是,谷歌云的业绩增长还算不错。云计算平台和工作App,每年能带来40亿美元的收入。但谷歌云的实际业绩,与亚马逊相比,还有数量级上的差距。

亚马逊第四季度云计算业务收入51亿美元,谷歌云据说一个季度的收入已经可以超过10亿美元。虽然仍然落后亚马逊,但确实是巨大的进步。

除了云,谷歌的Pixel手机、智能音箱等硬件设备,虽然也提升了营销费用。但与苹果公司相比,谷歌落后的距离已经不值得再比较了。

总结一下,Alphabet第四季度净亏损30亿美元,去年同期是净赚53亿美元。

受到财报影响,Alphabet的股价盘后出现下跌。

还有一事,施密特此前宣布卸任后,Alphabet终于迎来了新的董事长:斯坦福前任校长John Hennessy。

今天,亚马逊和苹果也发布了财报。

量子位把主要数据列在下面。

亚马逊第四季度营收为604.53亿美元,净利润18.56亿美元;全年营收1779亿美元,净利润30亿美元。

对于(很可能)还不赚钱的业务——Alexa,亚马逊很看重,在电话会议里提了19次,成绩也相当不错。Alexa目前已经有3万来自外部开发人员的"技能",可以控制1200个品牌的4000多种设备。

第四季度对于苹果来说是2018财年第一财季,这个季度他们的净营收是882.93亿美元,净利润200.65亿美元。

不愧是苹果~

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2rZIe7l
RSS Feed

RSS5

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...