2017年11月2日星期四

无监督神经机器翻译:仅需使用单语语料库

神经机器翻译近期取得很大成功,但缺乏双语数据的语言对很难基于现有方式训练出好的机翻系统。近日,有研究者提出一种无监督新方法,无需使用平行语料库,使用去噪和回译的步骤构建 NMT 系统。该系统在 WMT 2014 法语-英语和德语-英语翻译中分别取得了 15.56 和 10.21 的 BLEU 得分。


论文:Unsupervised Neural Machine Translation




论文链接:http://ift.tt/2xGeDOE


摘要:近期神经机器翻译(NMT)在标准基准上取得了很大成功,但是缺乏大型平行语料库对很多语言对是非常大的问题。有几个建议可以缓解该问题,比如三角剖分(triangulation)和半监督学习技术,但它们仍然需要强大的跨语言信号(cross-lingual signal)。本论文中,我们完全未使用平行数据,提出了用完全无监督的方式训练 NMT 系统的新方法,该方法只需使用单语语料库。我们的模型在近期关于无监督嵌入映射的研究基础上构建,包含经过少许修改的注意力编码器-解码器模型(attentional encoder-decoder model),该模型使用去噪和回译(backtranslation)结合的方式在单语语料库上进行训练。尽管该方法很简单,但我们的系统在 WMT 2014 法语-英语和德语-英语翻译中分别取得了 15.56 和 10.21 的 BLEU 得分。该模型还可以使用小型平行语料库,使用 10 万平行句对时,该模型分别取得了 21.81 和 15.24 的 BLEU 得分。我们的方法在无监督 NMT 方面是一个突破,为未来的研究带来了新的机会。



图 1:系统架构。


对语言 L1 中的每个句子,该系统都通过两个步骤进行训练:去噪——利用共享编码器优化对句子带噪声版本进行编码和使用 L1 解码器重构句子的概率;回译——在推断模式(inference mode)下翻译该句子(使用共享编码器编码该句子,使用 L2 解码器进行解码),然后利用共享编码器优化对译文句子进行编码和使用 L1 解码器恢复源句子的概率。交替执行这两个步骤对 L1 和 L2 进行训练,对 L2 的训练步骤和 L1 类似。


3.1 系统架构


如图 1 所示,我们提出的系统使用比较标准的带有注意力机制的编码器-解码器架构(Bahdanau et al., 2014)。具体来说,我们在编码器中使用一个双层双向 RNN,在解码器中使用另一个双层 RNN。所有 RNN 使用带有 600 个隐藏单元的 GRU 单元(Cho et al., 2014),嵌入的维度设置为 300。关于注意力机制,我们使用 Luong et al. (2015b) 提出的全局注意力方法,该方法具备常规对齐功能。但是,我们的系统与标准 NMT 在三个方面存在差异,而正是这些差异使得我们的系统能够用无监督的方式进行训练:


1. 二元结构(Dual structure)。NMT 系统通常为特定的翻译方向搭建(如法语到英语或英语到法语),而我们利用机器翻译的二元本质(He et al., 2016; Firat et al., 2016a),同时进行双向翻译(如法语 ↔ 英语)。


2. 共享编码器。我们的系统仅使用一个编码器,该编码器由两种语言共享。例如,法语和英语使用同一个编码器。这一通用编码器旨在产生输入文本的语言独立表征,然后每个解码器将其转换成对应的语言。


3. 编码器中的固定嵌入。大多数 NMT 系统对嵌入进行随机初始化,然后在训练过程中对其进行更新,而我们在编码器中使用预训练的跨语言嵌入,这些嵌入在训练过程中保持不变。通过这种方式,编码器获得语言独立的词级表征(word-level representation),编码器只需学习如何合成词级表征来构建较大的词组表征。如 Section 2.1 中所述,存在多种无监督方法利用平行语料库来训练跨语言嵌入,这在我们的场景中也是可行的。注意:即使嵌入是跨语言的,我们仍然需要使用每种语言各自的词汇。这样,同时存在于英语和法语中的单词 chair(法语意思是「肌肉」)在每种语言中都会获得一个不同的向量,尽管两个向量存在于共同的空间中。


3.2 无监督训练


NMT 系统通常用平行语料库进行训练,由于我们只有单语语料库,因此此类监督式训练方法在我们的场景中行不通。但是,有了上文提到的架构,我们能够使用以下两种策略用无监督的方式训练整个系统:


1. 去噪


我们使用共享编码器,利用机器翻译的二元结构,因此本文提出的系统可以直接训练来重构输入。具体来说,整个系统可以进行优化,以使用共享编码器对给定语言的输入句子进行编码,然后使用该语言的解码器重构源句子。鉴于我们在共享编码器中使用了预训练的跨语言嵌入,该编码器学习将两种语言的嵌入合称为语言独立的表征,每个解码器应该学习将这类表征分解成对应的语言。在推断阶段,我们仅用目标语言的解码器替代源语言的解码器,这样系统就可以利用编码器生成的语言独立表征生成输入文本的译文。


但是,相应的训练过程本质上是一个琐碎的复制任务,这使得上述完美行为大打折扣。该任务的最佳解决方案不需要捕捉语言的内部结构,尽管会有很多退化解只会盲目地复制输入序列的所有元素。如果确实如此的话,该系统的最好情况也不过是在推断阶段进行逐词替换。


为了避免出现此类退化解,使编码器真正学会将输入词语合成为语言独立的表征,我们提出在输入句子中引入随机噪声。这个想法旨在利用去噪自编码器(denoising autoencoder)同样的基本原则(Vincent et al., 2010),即系统被训练用于重构带噪声输入句子的原始版本(Hill et al., 2017)。为此,我们通过随机互换相邻词语来改变输入句子的词序。具体而言,对于包含 N 个元素的序列,我们进行 N/2 次此类随机互换操作。这样,该系统需要学习该语言的内部结构以恢复正确的词序。同时,我们不鼓励系统过度依赖输入句子的词序,这样我们可以更好地证明跨语言的实际词序离散。


2. 回译


尽管存在去噪策略,上述训练步骤仍然是一个复制任务,其中包含一些合成的改动,最重要的是,每次改动都只涉及一种语言,而非同时考虑翻译的两种语言。为了在真正的翻译环境中训练新系统,而不违反仅使用单语语料库的限制,研究人员提出引入 Sennrich 等人 2016 年提出的回译方法。具体说来,这种方法是针对给定语言的一个输入句,系统使用贪心解码在推断模式下将其翻译成另一种语言(即利用共享编码器和另一种语言的解码器)。利用这种方法,研究人员得到了一个伪平行语料库,然后训练该系统根据译文来预测原文。



表 1:几种系统在 newstest2014 上的 BLEU 得分。无监督系统利用 News Crawl 单语语料库进行训练,半监督系统利用 News Crawl 单语语料库和来自 News Commentary 平行语料库的 10 万句对进行训练,监督学习系统(作为对比)使用来自 WMT 2014 的平行语料库进行训练。其中,Wu et al. 2016 年提出的 GNMT 取得了单模型的最佳 BLEU 得分。



表 2:本文提出的系统使用 BPE 对 newstest2014 中的部分句子进行法语到英语的翻译。


6 结论


在本论文中,研究人员提出用无监督方法训练神经机器翻译系统的新方法。它建立在无监督跨语言嵌入的现有工作上(Artetxe 等人,2017;Zhang 等人,2017),并将它们纳入修改后的注意力编码器-解码器模型中。通过使用带有固定跨语言嵌入的共享编码器,结合去噪和回译,我们实现了仅利用单语语料库训练 NMT 系统。


实验显示了新方法的有效性,在标准 WMT 2014 法语-英语和德语-英语基准测试中,新方法的 BLEU 得分显著超过执行逐词替换的基线系统。我们也手动分析并确定了新系统的表现,结果表明它可以建模复杂的跨语言关系并生成高质量的译文。此外,实验还表明新方法结合一个小型平行语料库可以进一步提升系统性能,这对于训练数据不足的情况非常有用。


新的工作也为未来研究带来了新的机会,尽管该研究在无监督 NMT 方面是一个突破,但仍有很大改进空间。其中,在研究中用于比较的监督 NMT 系统不是业内最佳,这意味着新方法带来的修正同样也限制了其性能。因此,研究人员接下来将检查这一线性的原因并尝试缓解。直接解决它们不太可行,我们希望探索两个步骤,时序 i 安按照当前方式训练系统,然后恢复主要的架构变更,再进行精确调整。另外,研究人员还将探索将字符级信息纳入模型,这可能会有助于解决训练过程中出现的一些充分性问题。同时,如果解决了罕见词,特别是命名实体的问题,该系统的表现将进一步提升。

]]> 原文: http://ift.tt/2iqm46e
RSS Feed

机器知心

IFTTT

第七课:物体检测

时间:北京时间 11月4号星期六早11点到中午12点地点:将门斗鱼直播:http://ift.tt/2gwbSMo

【注意】年底了小伙伴们也要开始冲刺年底考核了,所以将课程从两个小时改到一个小时。但是大家不用担心,一定会将深度学习各个方向逐一介绍完

本周我们将开始讲计算机视觉里的一个重要课题,物体检测。我们将从使用卷积神经网络的开山做R-CNN讲起,一直到最近的算法。

具体link稍后在http://ift.tt/2xSxfLB里更新。



via gluon - 知乎专栏 http://ift.tt/2AdDVoQ
RSS Feed

RSS8

IFTTT

追一科技完成2060万美元B轮融资,AI公司靠垂直服务赚钱的好时候到了吗?

撰文 | 吴欣


11 月 2 日,机器之心独家获悉,专注深度服务企业的 AI 公司追一科技已经完成 2060 万美元规模 B 轮融资。本轮投资由创新工场领投,GGV 纪源资本及追一科技原始股东晨兴资本、高榕资本跟投。在此之前,2016 年 1 月,追一科技获得晨兴资本百万美金天使投资,2016 年 9 月,再获得高榕资本、晨兴资本数百万美金 A 轮投资。


作为 B 轮投资领投方,创新工场看重追一科技对深度学习与 NLP 的结合,以及产品研发迭代、客户开发能力,另一方面,李开复认为,「(追一科技)技术优势够清晰,赛道可拓展机会也足够大。」


追一科技是一家用深度学习和自然语言处理技术帮助企业搭建智能交互解决方案的创业公司。在滴滴、携程、招商银行信用卡、OFO、小米、万达集团、长江证券、阳光保险等公司的背后,都有追一科技的 YiBot 智能服务系统,用来响应人机协同、大数据分析、个性化服务等多个领域的 AI 应用需求。


在追一科技创始人兼 CEO 吴悦看来,B 轮融资标志着,追一科技会进入一个更有竞争力的发展阶段,公司会在技术研发、产品迭代和人才招募方面增加投入。


在创办追一科技之前,吴悦是腾讯基础架构的几个创始员工之一,他不仅和同事搭建了腾讯存储的基础架构体系,并于2012 年负责 Soso 网页搜索的架构体系,Soso 业务卖掉之后,吴悦留任腾讯 TEG 事业群搜索部门负责人,业务涵盖微信、QQ、应用宝、腾讯视频、腾讯音乐等应用的搜索,并主持开发了天天快报的核心算法推荐引擎。


吴悦在算法方面的深厚积累,以及高管团队在腾讯近 10 年的技术与产品经验,兼具算法、工程、商业基因,同样是晨兴资本合伙人程宇、GGV 纪源资本管理合伙人符绩勋看好追一科技的重要原因。「将 NLP 与人工智能技术应用于客服场景时,追一科技在算法表现之外格外注重产品的体验和对场景的适应。同时,在销售市场側并非只专注互联网公司,更是在金融领域深耕,这些都是我们看好追一的理由。」符绩勋说。


从投资人的关注点也不难看出,人工智能公司融资水涨船高,主要竞争焦点就是谁能真正深入垂直产业并创造足够的收益、抢占足够大的市场。除了充分的资金、前沿技术敏锐度,更需要的是公司拥有技术产品化的能力,深度理解不同行业需求把技术落到应用场景中。


在这次融资发布之前,追一科技向机器之心独家回应了关于行业发展、公司变化的问题。


在追一科技所在的智能客服领域里,目前处于怎样的发展阶段?


现在智能客服基本框架已经有了,可以解决一些基本、简单、重复性的问题,减轻一部分人工工作量,但离真正的深场景结合、人机协同、高价值发挥,以及更有价值的人企交互入口,还有一段距离,而且还面临着企业内部互联互通、技术与场景如何结合等一系列挑战。


智能客服的发展,必然是向智能化的人企交互入口衍变。其形态和能够提供服务,都会有质的变化,将为用户解决更为专业、复杂化的问题,机器和人的效率都会得到提升,并为企业提供从产品、服务、商业创新等一系列延伸价值。


到什么条件下,能够明确行业进入下一个阶段?有哪些具体判断指标吗?


这取决于多方面因素。


技术本身的迭代创新,能够支撑一些商业创想,而且最重要的是技术必须能够结合场景用户需求,落地产品化,这都需要时间推进。目前,场景依然是大家都在积极努力的方向。


同时,作为 AI 服务商,我们的能力还必须与企业需求密切集合,企业自身的发展状况、需求和内部互联互通等一系列因素,也会影响行业发展。我们一直与企业保持密切协作,相互促进,希望能够尽快推动企业智能化入口实现,为企业创造更大价值。


我们看到人工智能领域融资额越来越高,是不是意味着创业的门槛也在提高?在追一这个领域里,未来会逐渐形成怎样的格局?


融资活跃,说明了资本市场对人工智能前景特别是商业化落地看好。


人工智能创业,因为资本涌入和产业化突破,也在发生变化,尤其是技术和产品化壁垒有所提升,但整体壁垒依然取决于技术、产品与行业结合程度,对企业应用场景的触达深度。目前,整个行业依然处于布局探索阶段。


而未来,在人工智能的服务世界里,智能化的人企交互将是一个重要方向,对现有企业服务形态、内容、价值进行重塑。追一科技从创业起步,就非常注重 NLP、深度学习等AI技术与企业场景结合,我们在场景化应用上,已经取得了突破,积累了很多典型用户。


在之前的采访里,你也提到技术产品化的重要性,你认为,想做到足够好需要具备的条件是什么?


技术产品化,最重要条件是技术能够落地场景,解决用户痛点。


要做好产品化,首先要先去了解市场痛点,通过企业、行业、专家等多种渠道。然后,针对企业的需求和痛点,比如解决成本问题、提升效率或是体验问题,把技术落地到行业场景,形成通用化、标准化产品。


在落地过程中,一定要做好业务系统对接,将业务逻辑落地成通过可执行的操作,从而实现用户需求。然后,再沉淀成一整套解决方案。


具体到对话机器人,以你对产品的要求,好用的机器人具备哪些要素?


好的机器人需要有高智商、高情商,主动学习的能力,对业务知识有专业的理解,并且能在各个业务场景下都游刃有余。


高智商体现在能准确理解用户的意图,主动学习的能力指的是知道自己哪些问题能回答哪些没有把握回答,并将没有把握的问题主动请教业务专家。也就是说,机器人还需要进一步深入到各个垂直行业中去学习人机交互场景,行业中的专业知识。


除此之外,在追一的发展过程中,你最看重的东西是什么?


综合性的服务能力。特别是在 AI 这种新兴产业中,企业更需要综合性素质,单点优势都不足以击击穿市场。技术需要与企业场景非常深度结合,以技术创新性与企业需求结合,解决用户痛点并实现业务服务创新。期间,如何更好地理解用户需求,还需要专业化的人才,尤其是兼具技术、产品和行业理解的复合型人才。


接下来,公司会着重在哪些方面发力?


AI 与企业场景结合、提供更深入的价值上,还有很长的路要走,我们会不断加大技术研发创新的力度,并密切地关注企业需求和市场变化,更深入地耕耘企业市场,把 AI 技术与企业场景更密切地集合;同时,随着 AI 与行业结合日趋深入,复合型人才需求越来越多,我们也会继续发力人才队伍建设。


]]> 原文: http://ift.tt/2xNAIec
RSS Feed

机器知心

IFTTT

AlphaGo Zero:笔记与伪代码

近日,Google DeepMind 在 Nature 上发表了一篇论文,介绍了这家世界顶级人工智能机构在计算机围棋方面的最新研究成果 AlphaGo Zero(参阅机器之心文章《无需人类知识,DeepMind 新一代围棋程序 AlphaGo Zero 再次登上 Nature》)。这个在学习过程中没有使用任何人类知识的人工智能程序可以轻松地以 100 比 0 的成绩击败去年 3 月战胜了李世乭的 AlphaGo 版本。AlphaGo Zero 论文发布之后,阿尔伯塔大学 Yuxi Li 博士对该程序的工作原理进行了分析,并使用伪代码的方式对其训练过程进行了描述。原文链接请参见http://ift.tt/2gVjDIs

 

1 引言

 

2016 年 3 月,AlphaGo(Silver et al., 2016)击败了带有 18 个国际冠军头衔的人类顶级围棋手,造就了人工智能领域的一大里程碑。AlphaGo Zero(Silver et al., 2017)则实现了更进一步的提升,在不使用人类知识的情况下学习到了一个超人水平的计算机围棋程序。


AlphaGo(Silver et al., 2016; 2017)立足于深度学习、强化学习(RL)和蒙特卡洛树搜索(MCTS)。这一波深度强化学习浪潮起始于深度 Q 学习(Mnih et al., 2015);全面概述请参阅 Li (2017) http://ift.tt/2imXfrM

 

Sutton 和 Barto (2017) 对 AlphaGo 进行了详细且直观的描述。关于 AlphaGo 和 AlphaGo Zero 的介绍参阅 DeepMind 的官方博客:http://ift.tt/2ciFq8V 和 http://ift.tt/2ip5x2f Littman (2015)。

 

2 伪代码

 

我们提供了一个用于训练 AlphaGo Zero 的简要的概念性的伪代码,有助于你更轻松地理解 AlphaGo Zero 的原理;参见后文算法 1。详细情况请参阅原论文(Silver et al., 2017)。

 

AlphaGo Zero 可以被理解成是一种近似策略迭代(approximation policy iteration),并在其训练循环中集成了 MCTS 以改进策略和评估策略。MCTS 可以被看作是一种策略改进算子(policy improvement operator),可以输出比神经网络的原始概率更强的走子概率。使用搜索的自我对弈可以被看作是一种策略评估算子(policy evaluation operator)。它使用了 MCTS 来选择走子,并将对弈赢家看作是价值函数的样本。然后这个策略迭代过程会更新神经网络的权重,从而将走子的概率和价值与提升后的搜索概率和自我对弈赢家更紧密地匹配起来,然后再在下一次迭代中使用更新后的神经网络权重执行自我对弈,以使其搜索更加强大。

 

与 AlphaGo 相比,AlphaGo Zero 的特性有:

 

1. 它是从随机对弈学习的,使用了自我对弈强化学习,没有使用人类数据或监督;

2. 它使用了棋盘上的黑白子作为输入,而没有使用任何人类参与的特征工程;

3. 它使用了单个神经网络来同时表征策略和价值,而没使用单独的策略网络和价值网络;

4. 它的局面评估使用了神经网络,MCTS 使用了走子采样,而没有执行蒙特卡洛 rollout。

 

AlphaGo Zero 使用了神经网络领域近年来的多种成就:残差卷积神经网络(ResNet)、批规范化(batch normalization)和非线性整流函数(rectifier nonlinearities)。

 

AlphaGo Zero 的自我对弈训练流程中有三个主要部门以异步的方式并行执行:

 

1. 根据近期的自我对弈数据持续地优化神经网络的权重;

2. 持续地评估棋手;

3. 使用最强的棋手来生成新的自我对弈数据。

 

当 AlphaGo Zero 与对手下棋时,MCTS 会搜索当前的状态,根据训练后的神经网络权重生成走子概率,然后选择一种走子方式。

 

3 讨论

 

AlphaGo Zero 是一种强化学习算法。AlphaGo Zero 既不是监督学习,也不是无监督学习。对弈分数是奖励信号,而不是监督标签。对损失函数 l 的优化是监督学习。但是,它会在策略迭代的单次迭代中执行策略评估和策略改进。

 

AlphaGo Zero 不仅是一种启发式搜索算法。AlphaGo Zero 更是一种策略迭代过程,其中启发式搜索算法(尤其是 MCTS)发挥了关键性的作用,但这个过程处于强化学习策略迭代的方案之中,如算法 1 中的伪代码所示。MCTS 可以被看作是一种策略改进算子。

 

AlphaGo 达到了超人类的水平。也许可以确定职业棋手已经开发出了一些有效的策略。但是,AlphaGo 并不需要模仿职业棋手的下法。因此它也不需要正确预测他们的走子。

AlphaGo Zero 的输入包括棋盘局面、历史记录和要下的颜色的原始棋盘表示,是以 19×19 的图像形式提供的;游戏规则;一个对弈评分函数;在旋转和翻转时的游戏规则不变性以及颜色转换情况下的不变性(除了贴目情况)。另外的关键输入是坚实的研究和开发经验。

 

AlphaGo Zero 使用了 64 个 GPU 工作站(每一个都有多个 GPU)和 19 个 CPU 参数服务器(每一个都有多个 CPU)进行训练,使用了 4 个 TPU 进行比赛时的执行。

 

AlphaGo 的训练需要巨量数据,所以它仍然是一个大数据问题。但是,因为计算机围棋有一个完美的模型或精确的游戏规则,这些数据就可以通过自我对弈生成。

 

由于计算机围棋存在完美模型或精确游戏规则,所以 AlphaGo 算法有局限性。比如在医疗健康、机器人和自动驾驶等问题上,通常难以收集到大量数据,得到足够接近甚至完美的模型就更难甚至完全不可能了。因此,我们不能直接将 AlphaGo 算法应用到这些应用上。

 

另一方面,AlphaGo 算法,尤其是其底层的技术(即深度学习、强化学习和蒙特卡洛树搜索),则有很多应用。Silver et al. (2016) 和 Silver et al. (2017) 推荐了以下应用:通用的游戏问题(尤其是视频游戏)、经典的规划问题、仅观察到部分信息的规划问题、调度问题、约束满足问题、机器人、工业控制和在线推荐系统。AlphaGo Zero 博客还提到了以下结构化问题:蛋白质折叠、降低能耗和搜寻革命性的新材料。参阅 Li (2017) 了解更多 AlphaGo 算法的应用和底层技术(尤其是深度强化学习)。

 

AlphaGo 已经取得了惊人的进展并为人工智能建立了一个里程碑。但是,我们离实现通用人工智能(AGI)的目标仍然相距甚远。


参考文献

 

Li, Y. (2017). Deep Reinforcement Learning: An Overview. ArXiv e-prints.

Littman, M. L. (2015). Reinforcement learning improves behaviour from evaluative feedback. Nature, 521:445–451.

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., Graves, A., Riedmiller, M., Fidjeland, A. K., Ostrovski, G., Petersen, S., Beattie, C., Sadik, A., Antonoglou,I., King, H., Kumaran, D., Wierstra, D., Legg, S., and Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540):529–533.

Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., Van Den Driessche, G., Schrittwieser, J., Antonoglou, I., Panneershelvam, V., Lanctot, M., et al. (2016). Mastering the game of go with deep neural networks and tree search. Nature, 529(7587):484–489.

Silver, D., Schrittwieser, J., Simonyan, K., Antonoglou, I., Huang, A., Guez, A., Hubert, T., Baker, L., Lai, M., Bolton, A., Chen, Y., Lillicrap, T., Hui, F., Sifre, L., van den Driessche, G., Graepel, T., and Hassabis, D. (2017). Mastering the game of go without human knowledge. Nature, 550:354–359.

Sutton, R. S. and Barto, A. G. (2017). Reinforcement Learning: An Introduction (2nd Edition, in preparation). MIT Press.

 

算法 1:AlphaGo Zero 训练过程的伪代码,基于 Silver et al. (2017)


AlphaGo Zero 伪代码原版:



伪代码中文版:



]]> 原文: http://ift.tt/2inDeBm
RSS Feed

机器知心

IFTTT

追一科技完成B轮2060万美元融资,创新工场领投

11 月 2 日,机器之心独家获悉,专注深度服务企业的 AI 公司追一科技已经完成 2060 万美元规模 B 轮融资。本轮投资由创新工场领投,GGV 纪源资本及追一科技原始股东晨兴资本、高榕资本跟投。在此之前,2016 年 1 月,追一科技获得晨兴资本百万美金天使投资,2016 年 9 月,再获得高榕资本、晨兴资本数百万美金 A 轮投资。

作为 B 轮投资领投方,创新工场看重追一科技对深度学习与 NLP 的结合,以及产品研发迭代、客户开发能力,另一方面,李开复认为,「(追一科技)技术优势够清晰,赛道可拓展机会也足够大。」


追一科技是一家用深度学习和自然语言处理技术帮助企业搭建智能交互解决方案的创业公司。在滴滴、携程、招商银行信用卡、OFO、小米、万达集团、长江证券、阳光保险等公司的背后,都有追一科技的 YiBot 智能服务系统,用来响应人机协同、大数据分析、个性化服务等多个领域的 AI 应用需求。


在追一科技创始人兼 CEO 吴悦看来,B 轮融资标志着,追一科技会进入一个更有竞争力的发展阶段,公司会在技术研发、产品迭代和人才招募方面增加投入。


在创办追一科技之前,吴悦是腾讯基础架构的几个创始员工之一,他不仅和同事搭建了腾讯存储的基础架构体系,并于2012 年负责 Soso 网页搜索的架构体系,Soso 业务卖掉之后,吴悦留任腾讯 TEG 事业群搜索部门负责人,业务涵盖微信、QQ、应用宝、腾讯视频、腾讯音乐等应用的搜索,并主持开发了天天快报的核心算法推荐引擎。


吴悦在算法方面的深厚积累,以及高管团队在腾讯近 10 年的技术与产品经验,兼具算法、工程、商业基因,同样是晨兴资本合伙人程宇、GGV 纪源资本管理合伙人符绩勋看好追一科技的重要原因。「将 NLP 与人工智能技术应用于客服场景时,追一科技在算法表现之外格外注重产品的体验和对场景的适应。同时,在销售市场并非只专注互联网公司,更是在金融领域深耕,这些都是我们看好追一的理由。」吴陈尧说。


从投资人的关注点也不难看出,人工智能公司融资水涨船高,主要竞争焦点就是谁能真正深入垂直产业并创造足够的收益、抢占足够大的市场。除了充分的资金、前沿技术敏锐度,更需要的是公司拥有技术产品化的能力,深度理解不同行业需求把技术落到应用场景中。


]]> 原文: http://ift.tt/2iTkrlu
RSS Feed

机器知心

IFTTT

离散优化代替反向传播:Pedro Domingos提出深度学习新方向

在改革深度学习、抛弃反向传播的道路上我们不仅看到了 Geoffrey Hinton 的努力。近日,《终极算法》一书作者,华盛顿大学计算机科学教授 Pedro Domingos 也提出了自己的方法——离散优化。


神经分类的原始方法是学习单层模型,比如感知机(Rosenblatt, 1958)。但是,将这些方法扩展至多层比较困难,因为硬阈值单元(hard-threshold unit)无法通过梯度下降进行训练,这类单元在几乎所有情况下导数都为 0,且在原点处非连续。因此,研究社区转向带有软激活函数(如 Sigmoid、ReLU)的多层网络,这样梯度可以通过反向传播进行高效计算(Rumelhart et al., 1986)。


该方法获得了巨大成功,使研究者使用数百层来训练网络,学得的模型在大量任务上取得非常高的准确率,效果超越之前的所有方法。但是,随着网络变得更深、更宽,出现了一种趋势:使用硬阈值激活函数进行量化,实现二元或低精度推断,可以大幅降低现代深层网络的能耗和计算时间。除量化以外,硬阈值单元的输出规模独立(或者不敏感)于输入规模,这可以缓解梯度消失和爆炸问题,帮助避免使用反向传播进行低精度训练时出现的一些反常现象(Li et al., 2017)。避免这些问题对开发可用于更复杂任务的大型深层网络系统至关重要。


出于以上原因,我们研究使用硬阈值单元学习深层神经网络的高效技术。我们观察到硬阈值单元输出离散值,这表明组合优化(combinatorial optimization)可能提供训练这些网络的有效方法,因此本论文提出了一种学习深层硬阈值网络的框架。通过为每个隐藏层激活函数指定离散目标集,该网络可分解成多个独立的感知机,每个感知机可以根据输入和目标轻松进行训练。学习深层硬阈值网络的难点在于设置目标,使每个感知机(包括输出单元)要解决的问题是线性可分的,从而达到目标。我们证明使用我们的混合凸组合优化框架可以学得这样的网络。


基于这一框架,随后我们开发了递归算法,一个可行的目标传播(FTPROP),用来学习深度硬阈值网络。由于这是一个离散优化问题,我们开发了启发法以设置基于每层损失函数的目标。FTPROP 的小批量处理版本可用于解释和证明经常使用的直通的评估器(straight-through estimator/Hinton, 2012; Bengio et al., 2013),现在这可被视为带有每层损失函数和目标启发法的一个特定选择的 FTPROP 实例。最后,我们开发了一个全新的每层损失函数,它能提升深度硬阈值网络的学习能力。我们实际展示了我们的算法在 CIFAR10 的直通评估器为两个卷积网路所带来的提升,以及在 ImageNet 上为带有多个硬阈值激活函数类型的 AlexNet 和 ResNet-18 所带来的提升。


图 1:在设置了一个深层硬阈值网络的隐藏层目标 T1 之后,该网络分解成独立的感知机,进而可通过标准方法被学习。


可行的目标传播


前面部分的开放性问题是如何设置隐藏层的优化目标。一般来说,对整个网络一次性生成优秀的、可行的(feasible)优化目标是十分困难的。相反,在一个层级上单次只提供一个优化目标却十分简单。在反向传播中,因为神经网络最后一层的优化目标是给定的,所以算法会从输出层开始,然后令误差沿着反向传播,这种反向传播就成功地为前面层级设定了优化目标。此外,因为获取优化的先验知识是非常困难的,那么如果某层级的目标对于一个给定的网络架构是可行的,我们就可以有一个简单的替代方案。该方案为层级 d 设置一个优化目标,然后优化前面层级已有的权重(即 j<=d 的层级权重)以检查该目标是不是可行。因为在优化层级时的权重和设置其上游目标(即其输入)时的目标相同,我们称之为诱导可行性(induce feasibility),即一种设置目标值的自然方法,它会选择减少层级损失 Ld 的优化目标。


然而,因为优化目标是离散的,目标空间就显得十分巨大且不平滑,它也不能保证在实际执行优化时能同时降低损失。因此启发式方法(heuristics)是很有必要的,我们会在本论文的下一部分详细解释这种启发式方法。d 层优化目标的可行性能通过递归地更新层级 d 的权重而确定,并根据 d-1 层的目标给出 d 层的优化目标。


这一递归过程会继续进行,直到传播到输入层,而其中的可行性(即线性可分型)能通过给定优化目标和数据集输入后优化层级的权重而简单地确定。层级 d 的优化目标能够基于从递归和层级 d-1 的输出而获得的信息增益中得到更新。我们称这种递归算法为可行的目标传播(FTPROP)。该算法的伪代码已经展示在算法 1 中。FTPROP 是一种目标传播 (LeCun, 1986; 1987; Lee et al., 2015),它使用离散型替代连续型而优化设置的目标。FTPROP 同样和 RDIS (Friesen & Domingos, 2015) 高度相关,该优化方法是基于 SAT 求解器的强大非凸优化算法,它会递归地选择和设置变量的自己以分解潜在的问题为简单的子问题。但 RDIS 仅适用于连续问题,但 RDIS 的思想可以通过和积定理(sum-product theorem/Friesen & Domingos, 2016)泛化到离散变量优化中。



当然,现代深层网络在给定数据集上不总是具备可行的目标设置。例如,卷积层的权重矩阵上有大量结构,这使得层输入对目标是线性可分的概率降低。此外,保证可行性通常会使模型与训练数据产生过拟合,降低泛化性能。因此,我们应该放松可行性方面的要求。


此外,使用小批量处理而不是全批处理训练有很多好处,包括改善泛化差距(参见 LeCun et al. 2012 或 Keskar et al. 2016),减少内存使用,利用数据增强的能力,以及为其设计的工具(比如 GPU)的流行。幸运的是,把 FTPROP 转化为一个小批量算法并放宽可行性需求非常简单。尤其是,由于不过度使用任何一个小批量处理非常重要,FTPROP 的小批量版本 (i) 每次只使用一个小批量的数据更新每一层的权重和目标;(ii) 只在每一层的权重上采取一个小的梯度下降步,而不是全部优化;(iii) 设置与更新当前层的权重并行的下游层的目标,因为权重不会改变太多; (iv) 删除对可行性的所有检查。我们把这一算法称作 FTPROP-MB,并在附录 A 算法 2 中展示了其伪代码。

FTPROP-MB 非常类似于基于反向传播的方法,通过标准库即可轻松执行它。


算法 2. MINI-BATCH 可行目标传播



图 2:(a)-(c)显示了不同层的损失函数(蓝线)及其导数(红色虚线)。(d)显示量化 ReLU 激活函数(蓝线),它是阶梯函数的总和,对应饱和的合页损失导数(红色虚线)总和,逼近这个总和的软合页损失性能最佳(黄色虚线)。


表 1. 在 CIFAR 10 或 ImageNet 上进行符号、qReLU 和全精度激活函数训练时,各种网络的 Top-1 准确度。硬阈值激活函数由 FTPROP-MB、逐层软合页损失函数(FTP-SH)与饱和直通估计(SSTE)训练。粗体显示了表现最好的激活函数


图 3. 不同激活函数的 alexNet 在 imageNet 上的 Top-1 训练(虚线)与测试(实线)准确度。小图显示了最后 25 个 epoch 的测试准确度。在两个大图中带有软合页损失(FTP-SH,红色)的 FTPROP-MB 要比饱和直通估计(SSTE,蓝色)要好。左图显示了带有标志激活的网络。右图展示了新方法(FTP-SH)使用 2-bit 量化 ReLU(qReLU)训练的表现与全精度 ReLU 几乎相同。有趣的是,在这里饱和 ReLU 的表现超过了标准 ReLU。


论文:Deep Learning as a Mixed Convex-Combinatorial Optimization Problem



论文链接:http://ift.tt/2A4Bxkv


随着神经网络变得越来越深,越来越宽,具有硬阈值激活的学习网络对于网络量化正变得越来越重要,还可以显著减少时间和能量的需求,用于构建高度集成的神经网络系统,这些系统通常会有不可微的组件,确保能避免梯度消失与爆炸以进行有效学习。然而,由于梯度下降不适用于硬阈值函数,我们尚不清楚如何以有原则的方式学习它们。


在本论文中,我们通过观察发现硬阈值隐藏单元的设置目标以最小化损失是一个离散的优化问题,这正好是问题的解决方式。离散优化的目标是找到一系列目标,使得每个单元,包括输出内容都有线性可分的解。因此,网络被分解成一个个感知机,它们可以用标准的凸方法来学习。基于这个方式,我们开发了一种用于学习深度硬阈值网络的递归小批量算法,包括流行但难以解释的直通估计(straight-through estimator)函数作为范例。实验证明,对比直通估计函数,新的算法可以提升多种网络的分类准确度,其中包括 ImageNet 上的 AlexNet、ResNet-18。


]]> 原文: http://ift.tt/2zbfXwA
RSS Feed

机器知心

IFTTT

2017年11月1日星期三

是的,我们正处于数字与实体混合生态的交叉路口


大数据文摘出品

作者:Martin Reeves, Daichi Ueda, Claudio Chittaro

翻译:大力,田奥,姜范波

编辑:亭八


我们正在进入一个数字与实体混合的交叉路口。这样的新兴机会给实体业创造了一个有价值生态系统的新机会。


提到数字与实体的混合生态,不得不提到2017年6月16日,亚马逊宣布将以大约137亿美元的价格收购全食超市(Whole Foods),震惊了业界。因为这项亚马逊目前为止最大的收购意味着:其对传统有机增长商业的发展策略有了重大的转折。


对于亚马逊此举背后的策略分析,人们众说纷纭,有人提出亚马逊Prime会员和全食超市的客户群体有着重叠性,有人提出了传统实体企业的存在价值,也有人认为这是要打造庞大生鲜供应链的需求。


无论这项交易的具体动机是什么,我们都认为这次的收购不是一次独立事件,而是亚马逊宏大蓝图的一部分:从目前的数字生态系统巨头转变为横跨数字和实体世界的更大赢家。这一转变给数字巨头和实体经营者带来了新的机遇,那就是建立一个新的数字-实体生态系统。这个混合生态系统会要求玩家们必须遵守一些新的原则,并且还会采用一系列与原有纯数字生态系统不同的举措。


日本第一人力公司Recruit就为我们提供了一个在这个新领域取得成功的绝佳范例。




数字巨头崛起的渊源


数字生态系统与公司和消费者动态互动的网络之间互相创造了价值,催生了现今社会一些最赚钱最有价值的商业模型。数字生态系统主要通过传递数字商品和服务、大规模的创造数字平台(例如双边市场),来创造价值。美国五个最有价值的上市公司——苹果、谷歌、微软、脸书和亚马逊,都是数字生态系统的玩家。这与十年前的对比是如此强烈,那时微软还是唯一的数字领域霸主,与其并肩的则是四个实业巨头(埃克森美孚、通用电气、AT&T和花旗集团)。


那么,数字生态系统是如何取得霸主地位的呢?答案就藏在一个赢家通吃的动态竞争环境中,赢家可以获得极其巨大的增长并建立自己坚不可破的防御体系。


在这个竞争环境下赢家有三个关键性因素:


第一.零边际成本和正向网络效应


一个成功的数字生态系统玩家会在他们的核心领域提供具有绝对优势的服务。想一想谷歌的搜索引擎和脸书的社交网络,以此为出发点,加上几乎为零的边际生产成本、网络集群效应、地理扩张的低门槛(缺乏相关的贸易保护制度)优势,这些公司都是从他们的数字生态系统慢慢发展到商业巨头的。例如数字商务平台亚马逊,就体现了这些特点:增加一项还是一千项产品的销售几乎不需要附加成本;平台的用户越多就越会吸引更多人成为用户;只需要很少的额外成本就可以将数字产品投放到全世界。


第二.前所未有的数据积累和分析


成功的数字巨头利用了所谓的"数据飞轮效应"优势,在数字生态系统成长中积累了更多的数据,更快地改进服务质量,从而获得了更多的增长。


累积的经验和对大数据的大幅度投资,驱动了数据处理和分析的改进,更增强了这个优势。数字巨头吸引和培养那些供不应求领域(如机器学习和数据工程)人才的能力,又进一步强化了这个良性循环。


第三.无缝衔接和综合性的数字化体验


一旦最终达到某个特定规模,通过给用户提供一个无缝衔接的体验和在单一平台上满足多项需求的能力,数字生态系统可以变得更为庞大。为了这个目的,这些赢家构造出了综合性的生态系统,囊括了众多不同服务的供应商。通过减少用户离开平台的意愿,这些生态系统能够获得用户绝大部分的注意力、时间和价值。


最显著的一个例子便是中国的一站式数字生态系统软件:微信,其整合了亚马逊、脸书、Instagram、推特、Yelp和其他应用的功能,所有的美国数字生态系统玩家也都在向这个方向发展。


数字生态系统的玩家都在全力利用这个赢家通吃的竞争局面以取得市场的主导地位。与之相反的是那些非数字型玩家,由于缺乏上述提到的优势,大部分都没能成功建立起数字生态系统。想想曾经的美国零售巨头希尔斯百货的命运,在2010年之后的头几年里大力投资电子商务业务,希望补足它的传统实体业务。结果,希尔斯百货的数字业务没能达到应有的规模,加上它所忽视的核心业务的销售滑铁卢,导致了公司市值流失超过75%。


数字与实体的交叉路口


数字巨头们到目前无往不利,系统内的实体部门只是一种补充性的基础设施,给顾客们提供服务(如亚马逊的仓库)或创造更好的交互平台(如苹果的旗舰店)。然而现在我们可以看到一种新的变化:创建横跨数字和实体、实现二者深度交互的生态系统的尝试在增加。在各种玩家中我们都可以看到这个变化:数字的、实体的以及新入场的。


看看数字领域里发生的这些事例。亚马逊除了对全食超市的收购外,也在建造与客户联通的实体渠道,例如亚马逊无人超市和亚马逊书店。与此同时,Etsy公司(一个以手工艺品买卖为主的电商平台)与梅西百货也达成合作进入了实体零售行业。Snap公司不仅推出了智能眼镜,还在上市融资前,将自己的定位从纯数字公司转变为数字和实体交叉的企业,称自己为一家"相机公司"。用阿里巴巴CEO张勇的话来说,这种转变的发生是因为:"今天我们总说不能把线上和线下割裂开来……所以为了更好的体验,我们需要将两者以新的方式结合。"


但传统企业们也没有闲着。通用电气就涉足物联网领域发布了Predix,这是一款基于云的联结工业机器并分析其数据改进其效能的平台。西门子也亦步亦趋地推出了另一款云平台MindSphere,并且卓有成效,帮助Amtrak(美国国家铁路客运公司)在2016年减少了33%的误点率。




最近,越来越多的新兴企业没有钻进实体或数字的单行道而是走上了两者的交叉道路。例如一些公司:Opendoor(房产交易网站)、Blue River Technology(农业机器人公司)和Prodea(云服务公司),利用AI产品作为切入点在实体产业中建立了自己的平台,力求成为数字-实体生态系统里住宅房地产领域、农业领域、物联网领域相应的一份子。


在数字与实体的交叉道路上创建生态网络的尝试情况变得越来越普遍。这种现象背后有三个主要因素:


1.前沿未开拓领域的商机。实体经济的体量仍然巨大。其体量虽然很难精确衡量,但是根据BCG(波士顿咨询公司)最近的估算,数字经济仅仅只占全球经济活动的8%。在部分纯数字经济日趋成熟的今天,越来越多的战场将会发生在实体领域中。


2.更多联网的硬件设备。数字世界和实体世界的界限变得越来越模糊。机器人、无人机、3D打印等新技术的出现使得数字技术可以蚕食以前那些无法单独用软件涉足的产业。实体经济与数字领域结合得越来越紧密。物流、制造、农业、房地产等产业开始重组,因为它们的资产越来越多地数字化、联网化。


3.更多实体世界的数据。联网硬件设备的增加也使得实体世界在数据能力上赶上数字领域。实体企业连上云端的数量越多,传感器就分布的越广;住在智能住宅的人越多,实体世界就会越多地成为熟练数字玩家的温床。换句话说,现实世界变得越来越数字化了。"数字飞轮"开始影响实体企业,其效果会波及各个领域。


新环境已然成为数字-实体混合型生态系统成长的沃土,这对竞争中的公司来说又意味着什么呢?


新的生态系统,新的挑战


正如本文前面提到的,数字生态系统依靠赢家通吃的动态局面,这个局面由零边际成本、网络集群效应、数据获取和用户便利四个特点支持。但是混合生态系统可不能仅靠技术和规模取胜。实体领域的运营意味着要面对硬件系统的繁复。混合生态系统的范围可能更窄,因为它们需要更深的专业知识和更密切的商业关系。系统的成长变慢,不仅是因为受到物理条件的约束,也是因为成长的先决条件通常需要经验和付出。因此,混合生态系统可能不会达到纯数字生态系统的宽度和广度。


以丰田为例,丰田精心构建了一个由供应商、创新者和合作商构成的混合生态系统,获得了顶级制造能力和持续的创新能力。丰田的超级生态系统是一个雏形,同时引入了一个稠密的传统实体供应商网络和一个更新的数字生态系统,后者囊括了车队管理、拼车和自动驾驶的潜在能力。丰田用数十年的时间打造了这个生态系统,投资给它的合作伙伴以及他们的潜在价值上面。即便如此,丰田仍然只是众多的汽车制造商玩家之一,全球市场份额不到20%。


混合生态系统和纯数字系统的区别,是生态演替模式的翻版。在新生物圈拓荒的物种(所谓的r物种)通过优先生长获胜。快速繁殖和传播使它们在生物圈内无往不利。然而随着生态系统日趋成熟,环境变得更为多元,新的策略就会出现。在后期阶段,能适应更高密度环境的物种(K物种)更有机会繁荣昌盛。它们的策略更多依靠投资祖辈而不是投资子孙,这种策略转变是生态环境变化产生的自然结果。


同理,不同类型的商业环境需要不同的管理手段。混合生态系统的管理至少需要三个主要转变方法:


1.技术和关系。技术优势显然是数字生态系统成功的关键因素;主要有三个技术挑战:推广一个强大的数字产品、实现此产品的规模化、使利益相关者能够在其上无缝进行无缝建造。数字生态系统的玩家倾向于只关注固定的关系而忽略其他。譬如,亚马逊出了名的顾客至上同时也相对忽视了它的第三方供应商。混合生态系统有着很高的技术要求,但在实体世界中,成功的商业通常依赖于定制化服务、咨询或者可实施性,商业关系也很重要。一个生态系统要成长为决定性的大体量,实施者必须有深入的了解并将现实世界人们和企业的行为改头换面纳入其中。这需要与其他玩家们建立强有力的联系,并发展特定的能力。在混合生态系统内创造价值不仅需要交易行为也需要变革管理。


2.深度和广度。广度是成功的数字生态系统的主要特征之一。例如,发达国家的绝大多数消费者都使用像Google和Facebook这样的近乎是数字生态垄断者的服务。但这些生态系统往往不会很深;它们没有针对特定的利基市场或特定的使用模式进行优化,而是着重于满足"共同需要"。混合生态系统需要发展足够的广度来达到临界体量,但同时必须深入关注特定问题,并利用有关领域的专门知识来解决这些问题。他们的商业模式依赖于通过解决具体问题创造更大的价值,而不是立身于一个巨大的开放的利基市场。只有这样才能完全满足客户需求。


3.新型生态系统的诞生和旧式生态系统的复兴。数字生态系统主要占据新兴的利基市场,占领者大都是一些暴发户。他们享有从头开始的奢侈便利条件,并在建立新市场的时候制定了市场规则。混合生态系统将主要涉及现有的利基市场,现有能力和现有竞争对手。因此,混合生态系统必须在创造全新能力和利用或积极重塑现有能力之间取得平衡。他们必须能够创造新的东西,并同时再造旧的东西。


那么,是否有哪家公司成功地将这些指导原则转化为行动呢?我们来看一个连续不断这样执行的公司,来证明它是一个可靠的可重复的公式。


Recruit集团:混合生态系统冠军


Recruit集团目前是日本最成功的大型企业之一,在近五年来的低迷经济依然保持年增长率接近20%。这家公司的管理方式:在旅游,餐饮,教育,二手车销售和招聘等领域建立多个数字-实体生态系统。在每个领域,Recruit集团旨在成为由数字和实体玩家组成的、集中垂直聚焦的混合生态系统的协调者。


例如,Recruit集团通过将数十万家餐馆和各种服务提供商以及开发者聚集在一个平台上,在日本建立了餐饮生态系统。通过这个平台,AirREGI,餐厅不仅可以访问各种Recruit集团自身提供的服务,还可以访问广告,会计,劳动力管理,采购,付款处理等数十个领域相关的服务,甚至还可以使用前沿的机器学习推荐引擎。虽然Recruit集团的角色是建立数字平台,但是它仅因为拥有与餐馆和供应商建立起关系的强大的战斗力就能渗透到实体餐厅市场。


Recruit集团已经成功建立混合生态系统,部分原因在于公司强调了提出可推广公式(称为"卡塔")的重要性。事实上,当它在选拔员工颁发全公司创新奖时,它会明确地寻找有潜能在多个场景中应用的创新项目。Recruit集团将他们建立和管理成功的混合生态系统的公式称为Ribbon模型。以下五个要素是这种模式的一些关键要素:


1.创造商业系列文化。考虑到垂直领域过于集中,混合生态系统的规模往往比不上广度型的数字生态系统。这意味着想要成为混合生态系统协调者的公司必须创造多个生态系统,以保持其增长曲线。事实上,这就是Recruit集团实现增长的方法:它投资了十几个生态系统。


这意味着Recruit集团必须聘请和培养创业人才,并通过在公司内部建立一个创业型生态系统来实现。Recruit集团身兼数职:种子加速器,风险投资家,顾问,后台服务提供商,以及公司内未来企业家的猎头。任何员工都可以申请开展新的业务计划,与外部人员合作,发展成为新的生态系统。Recruit集团通过这种方式来系统地发现、鼓励和培养创业人才。比如New Ring就是一个这样的项目,每年收到1000多个提案,并产生出一些Recruit集团的核心生态系统。


2.结合领域和技术专家。数字生态系统的竞争优势通常在于其卓越的技术,因而着迷于对技术人才:强大的工程师和设计师对于可扩展性和创造卓越的产品体验至关重要。然而,在混合生态系统中,领域专家也是必要的,他们能够发现和解决客户的深层次需求。因此,混合生态系统协调者的关键能力是招募领域和技术专家,并将其聚集在一起,共同解决挑战。


Recruit集团促进这些专家之间的协作,允许其顶尖人才在业务领域自由行动。例如,通过连线内容管理专家和身在其他公司的机器学习专家,Recruit集团能够大大降低处理在线客户评论相关的人工成本。这样的成功案例在企业级平台中共享,以激励其他技术专家和领域专家寻求合作的机会。


3.平衡生态系统的各个方面,包括供应方。在生态系统中,通常有一组特定的利益相关者可以产生收入(例如,消费者,广告客户或商业客户)。专注于满足创收方面的需求是很有吸引力的工作。在数字生态系统中,这个群体通常是最终消费者,而这些生态系统中的供应商和创新伙伴常常被忽视或挤压。混合生态系统比其他生态系统更为依赖于所有参与者,他们的协调者必须确保每个利益相关者群体得到公平的对待。


Recruit集团将这一概念建立在其生态系统管理模式中,将其自身作为消费者和供应商之间的粘合剂,在第一次接触和创造价值之间创造了许多显著的里程碑。例如,二手车销售生态系统消费者的里程碑包括意见数量,查询次数,个人联系人数和销售人数。然后将这些里程碑转化为KPI,并将其用作衡量跟踪生态系统整体健康状况的指标。


4.与其他利益相关者进行实验和共同演进。为了长期蓬勃发展,混合生态系统必须不断适应和学习。能够确定生态系统方向的协调者必须推动这一进程。但是,协调者不应该以议事规则来制定议程,而应该充当吸引学习机会的天线,以及帮助其他合作伙伴抓住利用这些机会。协调者必须谦虚地与其他成员进行实验和学习。


Recruit集团生态系统创新战略的核心是强大的领域实力和强调共同进化,因为Recruit集团的领域实力不仅要创造收入和实现目标,还要与客户建立深厚的关系,以便能够了解市场潜在的机会并动员他们周围的利益相关者。


例如,Recruit集团协调一个名叫Yuki Maji!19的大型活动以振兴日本的冬季运动。该运动为19岁的人提供免费滑雪门票,最初受到了度假村业主的严重抵制,但通过与广告商、政府机构、度假村和行业组织的合作,Recruit集团最终能够说服数百个度假村参与这项活动,这是商业上的成功。


5.有勇气重新搭建旧的生态系统。每个成功的公司都面临着从成功中产生的困境:通常很难改变正在运转的工作。正如众所周知的柯达和百视通公司的故事,他们拥有利润丰厚商业模式和充裕的资源,但仍然没有对高度可见的渗透行为作出足够的反应。这对实体公司和数字公司来说都是一个持续的威胁。为了赢得新的混合利基市场的战斗,公司必须愿意拆解他们现有的商业模式,无论是数字的还是实体的。通常,这需要创造一种紧迫感来激发自我破坏的能量。


Recruit集团在二十世纪初期将其杂志旅游生态系统(简称为Jalan)转变为在线旅游生态系统。Jalan在杂志上销售广告位,由于竞争日益激烈,每年收入下降5%。Jalan的在线平台一开始并没有预订功能,无法与更先进的在线旅行社竞争。在2000年后,Jalan经历了痛苦的转变,用一个全新的、未经测试的在线模式取代了旧的商业模式:Recruit集团通过任命新经理(从旅游业外)以发出业务向新的方向发展的信号,并在新模式盈利之前一直在其身上投资了七年之久。这种方法就像基因扩增治疗一样,公司全面引入了新的"基因",为旧的生态系统提供了新的功能。


"新"实体公司的发展路线


Recruit集团的经验表明了如何在数字到实体生态系统领域取得成功。但在这个领域,纯粹的实体公司也可以具有竞争力。在数字和实体交叉路口的新兴机会给实体业创造了一个有价值生态系统的新机会。


为了充分利用这些机会,实体业应该认识到,他们不是在追赶,而是在开创一个新的游戏——在这里,他们有可能定义新的利基市场和新的规则。实体企业的领导者也可以从Recruit集团中学习一些经验教训,以帮助他们走好自己的路。


所以,"新"实体公司的发展路线首先要加强战略的双向性,同时探索新的能力和利用旧的能力。管理相互矛盾的目标对于今天的所有企业领导者都至关重要,但对于尝试构建混合生态系统的人来说,这是倍加重要的。这项任务将涉及技术和关系,广度和深度以及创造和复兴。


第二,他们必须有勇气和有能力设想和塑造新的空间,并组织起来企业内部和外部的利益相关者。这些"塑造能力"往往与数字巨头公司更为密切相关。因此,实体公司开始投资于生态系统建设和管理相关的至关重要的管理技能,是更为迫切的事情。


最后,他们必须把混合生态系统作为重复多次而不是一次性的游戏。数字生态只要获胜一次就足够了,而混合生态系统往往会涉及到多次战胜对手和一个实现这一目标的系统。公司可能会在一个生态系统成为赢家,而在其他生态系统中成为参与者。这种动力学将有利于那些投资可重复模式的公司,以及优先考虑诚信和协作的公司。


数字生态系统是我们见过的最成功的商业模式创新之一。然而,它只是商业合作许多的可能模式之一。随着数字经济的生长和繁增,数字经济将不可避免地为数字-实体生态系统创造新机遇。实体业现在就应该开始做好准备。



]]> 原文: http://ift.tt/2lDw1BW
RSS Feed

机器知心

IFTTT

入职仅一年,套现5000多万后背刺马斯克搬走 Grok 核心代码库!-InfoQ 每周精要894期

「每周精要」 NO. 894 2025/09/06 头条 HEADLINE 入职仅一年,套现 5000 多万搬走 Grok 核心代码库! 业内专家:拥有菜谱不等于能做出同样的菜 精选 SELECTED AI 公司创始人现跑路迪拜! 80% 收入烧广告、假账骗投资人,微...