2017年12月5日星期二

不好,两群AI打起来了!“幕后主使”是上海交大~

夏乙 若朴 发自 凹非寺量子位 出品 | 公众号 QbitAI

你们这些科学家在干什么!怎么教会AI打群架啦!

成百上千的AI agent,分成两支AI大军对战起来。从动图中还可以看出来,它们的战斗方式并不是简单的平A,包围、游击等等高级战术在这三场AI战役中悉数登场。

战役发生的地点,是上海交大中英联合AI研究小组Geek.ai最新发布的强化学习平台:MAgent

强化学习平台不少,MAgent是一个异类。OpenAI Gym、微软Malmo等等前辈几经改进,却都只能训练一个或者几个智能体,就算它们强调"multi-agent",最多也不过支持几十个而已。

而在MAgent平台上,可以训练比更多还更多的agent,支持的量级可达到从数百到数百万。开发团队称之为"many-agent"。

量子位暂时按捺住把它翻译成"智能体大军"的冲动,在本文中就叫"群智能体"吧。

把这么多agent放在一起,要研究什么呢?我们先来看一段视频:

搭配BGM看小方块跑来跑去,莫名的燃~

Geek.ai团队说,把成百上万的agent聚集在一个环境中,是为了研究Artificial Collective Intelligence(ACI),也就是AI如何群策群力,创造集体智慧。ACI的研究虽然还很初步,但已经在股票交易、策略博弈、城市交通优化等等领域有所应用。

AI的集体智慧

在上面的视频里,成群的AI聚在一起形成了一个小社会,出现交流、竞争、合作等社会现象,里面的agent个体也会有种种社会行为。

视频就展示了基于MAgent设计的三个群智能体环境:追逐(Pursuit)、采集(Gathering)和战斗(Battle),大致相当于人类老祖宗们常做的三件事:一起打猎、出去摘果子、和另一拨老祖宗打架。

我们可以来看看agent在这三种环境中的行为:

追逐

在追逐环境中,红色智能体代表捕食者、蓝色表示猎物、灰色的是墙。捕食者包围、锁定猎物,接下来就能在攻击时就能得到奖励,而猎物被攻击会受到惩罚。

我们可以看到局部合作行为的出现。经过训练,四个捕食者会合作包围一个猎物,还会在包围猎物时利用墙壁作为辅助。

采集

在采集环境中,红色方块是食物,蓝色的是agent,agent可以互相攻击,吃到(采集到)食物就会获得奖励。有两个选择摆在他们面前:是直接去吃掉食物,还是杀死竞争者独占食物。

于是,竞争出现了。

经过训练,agent在一开始时会选择直接冲过去吃掉食物,如果两个agent相遇,就会尝试杀死对方、独占食物、获得奖励。食物越少,agent越好斗。

战斗

战斗环境,就是我们在文章最开头看到的AI打群架啦。

这其中既有合作又有竞争,红色和蓝色agent分别组成两支军队,杀死对手就能获得奖励,被杀死就会被惩罚。也就是说,agent在这个环境中的任务,是和队友合作去消灭敌军。

这些agent通过简单的自我对局训练,学会了全局和局部策略,包括包围、游击等等。

MAgent详情

在MAgent平台上,每个agent都是一个小方块,带有详细的局部信息,有些还带有全局信息。agent可以移动、旋转、攻击。

它们背后有一个C++引擎,支持多样化的agent,通过简单设置状态空间、行为空间和agent的属性,可以创造出多样的环境。

为了让用户灵活地设计环境,MAgent还提供一种用来描述奖励、agent标志、事件的语言,还支持"与/或/非"逻辑运算。

另外,MAgent还提供一个简单的图形化渲染器,对环境和agent的当前状态进行交互式展示,用户可以拖动、缩放窗口,甚至可以操纵游戏中的agent。

更多详情,可以看看MAgent的论文,或者把代码拿来上手试一试。

论文(将在AAAI-18 Demonstrations Program上展示):

MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence

Lianmin Zheng, Jiacheng Yang, Han Cai, Weinan Zhang, Jun Wang, Yong Yu

http://ift.tt/2Ac4bDW

代码:

http://ift.tt/2B1SkrX

背后的Geek(们)

这篇论文的共同第一作者,是上海交大的郑怜悯(Lianmin Zheng)和杨嘉成(Jiacheng Yang)。

公开信息显示,今年陈天奇团队发布TVM时,郑怜悯的名字曾出现在致谢名单中。去年上海交大第六届智能车校内赛上,郑怜悯和同学组队获得信标导引组的一等奖。中学时期,郑怜悯还曾获得温州市"小科学家"称号。

郑怜悯和杨嘉成,都是上海交大致远学院(基础学科拔尖学生培养试验计划)2015级计算机科学班的学生。

这篇论文的其他作者还包括,Han Cai、Weinan Zhang(张伟楠)、Jun Wang、Yong Yu(俞勇)。

其中,张伟楠是上海交通大学,计算机科学与工程系助理教授。他的研究兴趣包括机器学习和大数据挖掘,尤其是深度学习和(多智能体)强化学习的架构、机制、训练方法以及在真实场景中的应用。

张伟楠2016年从伦敦大学学院获得博士学位,2011年在上海交大ACM班获得学士学位。他曾在MediaGamma、微软研究院、Google和DERI实习。

Jun Wang是伦敦大学学院的信息系统和数据科学教授。他同时也是一家AI创业公司MediaGamma的联合创始人兼首席科学家,这家公司专注于实时决策。

Jun Wang博士毕业于荷兰代尔夫特理工大学,硕士毕业于新加坡国立大学,学士毕业于南京的东南大学。

俞勇是上海交通大学计算机科学与工程系教授,致远学院计算机科学方向项目主任,也被称为上海交大ACM总教头。

Han Cai的信息量子位没有查询到。

另外补充一个信息,Jun Wang和张伟楠等人,成立了一个名为Geek.AI的团队,这是一个中英联合AI研究小组。

这个研究小组专注于机器学习的高级问题和方法,包括监督/无监督学习(涵盖大多数预测应用,如推荐系统、图像识别和网页排名等),强化学习(涵盖所有决策应用,例如下围棋、自动驾驶、竞拍和智能选股等)。

除了他们两位,小组成员还包括Dell Zhang(张德),伦敦大学伯贝克学院,计算机科学高级讲师。他主要从事机器学习、数据挖掘、信息抽取、NLP、社会网络分析等领域的研究。

OMT

还有一事。

郑怜悯在GitHub上公布了他参与的几个项目,其中有一个Python写成的网页版"狼人杀",中午没事儿可以试一下~

地址在此:http://ift.tt/2Ac4dM4

初次登录,需要你填写用户名和密码,如果想下次继续登录,千万记好密码。登录之后就能创建游戏,或者加入房间了。

大概就是下面这个样子。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者



via 量子位 - 知乎专栏 http://ift.tt/2AbW89Y
RSS Feed

RSS5

IFTTT

不好,两群AI打起来了!“幕后主使”是上海交大~

夏乙 若朴 发自 凹非寺量子位 出品 | 公众号 QbitAI

你们这些科学家在干什么!怎么教会AI打群架啦!

成百上千的AI agent,分成两支AI大军对战起来。从动图中还可以看出来,它们的战斗方式并不是简单的平A,包围、游击等等高级战术在这三场AI战役中悉数登场。

战役发生的地点,是上海交大中英联合AI研究小组Geek.ai最新发布的强化学习平台:MAgent

强化学习平台不少,MAgent是一个异类。OpenAI Gym、微软Malmo等等前辈几经改进,却都只能训练一个或者几个智能体,就算它们强调"multi-agent",最多也不过支持几十个而已。

而在MAgent平台上,可以训练比更多还更多的agent,支持的量级可达到从数百到数百万。开发团队称之为"many-agent"。

量子位暂时按捺住把它翻译成"智能体大军"的冲动,在本文中就叫"群智能体"吧。

把这么多agent放在一起,要研究什么呢?我们先来看一段视频:

搭配BGM看小方块跑来跑去,莫名的燃~

Geek.ai团队说,把成百上万的agent聚集在一个环境中,是为了研究Artificial Collective Intelligence(ACI),也就是AI如何群策群力,创造集体智慧。ACI的研究虽然还很初步,但已经在股票交易、策略博弈、城市交通优化等等领域有所应用。

AI的集体智慧

在上面的视频里,成群的AI聚在一起形成了一个小社会,出现交流、竞争、合作等社会现象,里面的agent个体也会有种种社会行为。

视频就展示了基于MAgent设计的三个群智能体环境:追逐(Pursuit)、采集(Gathering)和战斗(Battle),大致相当于人类老祖宗们常做的三件事:一起打猎、出去摘果子、和另一拨老祖宗打架。

我们可以来看看agent在这三种环境中的行为:

追逐

在追逐环境中,红色智能体代表捕食者、蓝色表示猎物、灰色的是墙。捕食者包围、锁定猎物,接下来就能在攻击时就能得到奖励,而猎物被攻击会受到惩罚。

我们可以看到局部合作行为的出现。经过训练,四个捕食者会合作包围一个猎物,还会在包围猎物时利用墙壁作为辅助。

采集

在采集环境中,红色方块是食物,蓝色的是agent,agent可以互相攻击,吃到(采集到)食物就会获得奖励。有两个选择摆在他们面前:是直接去吃掉食物,还是杀死竞争者独占食物。

于是,竞争出现了。

经过训练,agent在一开始时会选择直接冲过去吃掉食物,如果两个agent相遇,就会尝试杀死对方、独占食物、获得奖励。食物越少,agent越好斗。

战斗

战斗环境,就是我们在文章最开头看到的AI打群架啦。

这其中既有合作又有竞争,红色和蓝色agent分别组成两支军队,杀死对手就能获得奖励,被杀死就会被惩罚。也就是说,agent在这个环境中的任务,是和队友合作去消灭敌军。

这些agent通过简单的自我对局训练,学会了全局和局部策略,包括包围、游击等等。

MAgent详情

在MAgent平台上,每个agent都是一个小方块,带有详细的局部信息,有些还带有全局信息。agent可以移动、旋转、攻击。

它们背后有一个C++引擎,支持多样化的agent,通过简单设置状态空间、行为空间和agent的属性,可以创造出多样的环境。

为了让用户灵活地设计环境,MAgent还提供一种用来描述奖励、agent标志、事件的语言,还支持"与/或/非"逻辑运算。

另外,MAgent还提供一个简单的图形化渲染器,对环境和agent的当前状态进行交互式展示,用户可以拖动、缩放窗口,甚至可以操纵游戏中的agent。

更多详情,可以看看MAgent的论文,或者把代码拿来上手试一试。

论文(将在AAAI-18 Demonstrations Program上展示):

MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence

Lianmin Zheng, Jiacheng Yang, Han Cai, Weinan Zhang, Jun Wang, Yong Yu

http://ift.tt/2Ac4bDW

代码:

http://ift.tt/2B1SkrX

背后的Geek(们)

这篇论文的共同第一作者,是上海交大的郑怜悯(Lianmin Zheng)和杨嘉成(Jiacheng Yang)。

公开信息显示,今年陈天奇团队发布TVM时,郑怜悯的名字曾出现在致谢名单中。去年上海交大第六届智能车校内赛上,郑怜悯和同学组队获得信标导引组的一等奖。中学时期,郑怜悯还曾获得温州市"小科学家"称号。

郑怜悯和杨嘉成,都是上海交大致远学院(基础学科拔尖学生培养试验计划)2015级计算机科学班的学生。

这篇论文的其他作者还包括,Han Cai、Weinan Zhang(张伟楠)、Jun Wang、Yong Yu(俞勇)。

其中,张伟楠是上海交通大学,计算机科学与工程系助理教授。他的研究兴趣包括机器学习和大数据挖掘,尤其是深度学习和(多智能体)强化学习的架构、机制、训练方法以及在真实场景中的应用。

张伟楠2016年从伦敦大学学院获得博士学位,2011年在上海交大ACM班获得学士学位。他曾在MediaGamma、微软研究院、Google和DERI实习。

Jun Wang是伦敦大学学院的信息系统和数据科学教授。他同时也是一家AI创业公司MediaGamma的联合创始人兼首席科学家,这家公司专注于实时决策。

Jun Wang博士毕业于荷兰代尔夫特理工大学,硕士毕业于新加坡国立大学,学士毕业于南京的东南大学。

俞勇是上海交通大学计算机科学与工程系教授,致远学院计算机科学方向项目主任,也被称为上海交大ACM总教头。

Han Cai的信息量子位没有查询到。

另外补充一个信息,Jun Wang和张伟楠等人,成立了一个名为Geek.AI的团队,这是一个中英联合AI研究小组。

这个研究小组专注于机器学习的高级问题和方法,包括监督/无监督学习(涵盖大多数预测应用,如推荐系统、图像识别和网页排名等),强化学习(涵盖所有决策应用,例如下围棋、自动驾驶、竞拍和智能选股等)。

除了他们两位,小组成员还包括Dell Zhang(张德),伦敦大学伯贝克学院,计算机科学高级讲师。他主要从事机器学习、数据挖掘、信息抽取、NLP、社会网络分析等领域的研究。

OMT

还有一事。

郑怜悯在GitHub上公布了他参与的几个项目,其中有一个Python写成的网页版"狼人杀",中午没事儿可以试一下~

地址在此:http://ift.tt/2Ac4dM4

初次登录,需要你填写用户名和密码,如果想下次继续登录,千万记好密码。登录之后就能创建游戏,或者加入房间了。

大概就是下面这个样子。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者



via 量子位 - 知乎专栏 http://ift.tt/2AbW89Y
RSS Feed

RSS5

IFTTT

2017无人驾驶智能车Hackthon

作为 AI 领域的关注者或者从业者。

你肯定没少听过下面这些话:

"没意思,现实生活中哪用得上?"

"不现实,也就是算法厉害一点,没有实际价值。"

"你怎么吹都是泡沫"

"离真正的人工智能差远了,预测未来20年都不会出现真人工智能"

小羊苏西也曾说过:

"纸上谈兵可不算真正的人工智能哦"

那我们就就玩点硬♂的!

2017无人驾驶智能车Hackathon(太库站)

时间:2017年12月23日 8:30

地点北京市海淀区中关村鼎好大厦A座三层太库

主题:为全球智慧交通储备人才力量

目标:让行业相关人员技术交流、为无人驾驶爱好者创造有力条件,帮助大家提升操作能力!

主办方提供:

1. 完整的硬件平台:包括视觉,语音,电机,开发板等等,满足小车基本的感知,运动和控制需要;

2. 基本的开发环境:Ubuntu系统,anaconda等,满足基本的开发需要;

3. 完整的说明文档:说明硬件参数,视觉,语音等模块调用的方法等等。

参赛人员任务:

在上述基础上,开发物体识别及追踪,车辆控制等算法

参赛对象:

相关行业背景工程师、学生、爱好者(参赛以3-5人小组团队赛,可自行组队团体报名也可单人报名现场组队)参赛选手自备笔记本电脑。

奖品

一等奖(1名)MSI 1070ti (¥3799)

二等奖(2名)Filco 机械键盘(¥2598)

三等奖(3名)罗技 M570 轨迹球鼠标(¥219)

鼓励奖(20名)小米充电宝

扫下方二维码联系客服报名:

主办单位:

合作媒体:

场地提供:



via 集智 - 知乎专栏 http://ift.tt/2jiUg51
RSS Feed

RSS7

IFTTT

2017年12月4日星期一

缄默期过后6小时,搜狗王小川回应一切(他说:会叫的狗不咬人)

李根 发自 乌镇米仓量子位 报道 | 公众号 QbitAI

北京时间12月4日下午13点,纽约时间12月4日午夜0点。搜狗上市缄默期正式结束,王小川可以"说话"了。

6个小时后,在世界互联网大会召开地乌镇,在暮光向晚中,在一小时的时间里,搜狗CEO密集回答了各种问题。

比如上市路演时被核心关注的问题、华尔街如何看来自中国的AI故事、搜狗未来的战略航向、上市后的股价、与百度的竞争、和搜狐腾讯的关系、涉足哪些AI智能硬件,以及"不上市就不结婚"……

这也算是王小川"回应一切"。

竞争

Q:上市时说要"重新定义搜索引擎",是要颠覆百度独大的格局吗?

王小川:颠覆市场格局主要有三件事情:一,竞争对手确实做得不够好。二,需要有一些跨代领先的技术。三,要和我们的一些核心能力匹配。

只有这三件事情同时满足的时候,我们才能重新定义搜索,比竞争对手做得更好。搜狗会展现出技术能力和产品创新力。

Q:百度如今All in AI,未来是否还要和这个老对手激烈竞争?

王小川:会叫的狗不咬人。我们对手每年都宣布新战略,我们面对这样的对手,并不感到害怕。

其次,我们战略方向很清晰,之前只有对方1/10甚至更少的人,但我们取得的实际应用的创新和突破要更多。

Q:不担心AI投入上不如百度吗?

王小川:历史证明,我们即便投入没有对手多,也比他们跑得快。包括现在,我们的语音识别,是对方数倍。

机器翻译,我们是首家发布同声传译系统的公司,也是全球唯一一个能够把翻译和搜索整合在一起做跨语言检索的公司,所以在AI技术里我们是领先的。

Q:数倍?

王小川:我指的的是语音识别的量,数倍,就不止两倍。

Q:现在AI投入产出悬殊很大,上市后如何平衡短期利益和长期利益?

王小川:我觉得搜索本身就是AI落地的一个好场景。随着AI发展,搜索会变成一种问答服务,它是渐变的,也许一开始5%的问题能够直接回答,未来10%或者15%,或者更多。

或者在垂直领域,比如医疗法律里做得更好,所以本身带来商业模式的向前发展。因此在这里面,我们的每一份投入都是能产生回报的。

Q:现在就会对营收效益有提升吗?

王小川:会啊,你搜索结果更准确,大家就会都用你,商业模式已经很清楚了。另外,用户体验提升也是我们的方向,翻译、唇语识别,有些项目带有情怀性,有些是主动战略匹配。

在这些方面继续往前走,我们可以提供更多有想象力的黑科技产品,能够持续提供惊喜。所以我们短期投入有保障,搜狗也是盈利公司,有力量投入到更多场景中。

IPO

Q:搜狗是中国首家AI概念上市的公司,华尔街最关注什么?

王小川:很多人问,未来搜索会不会进入到语音搜索?或者未来输入法是不是语音输入?我告诉他们,其实这还不具有足够多的想象力。

用语音进行输入是更方便,但还不够智能,比如你用语音说一个搜狗或者用文字敲一个搜狗,搜索引擎给你的答案都是相近或者一样的。

接下来,真正厉害的地方是机器在自然语言里产生阅读能力,未来我们提问,它最后不是给你十个链接和十个页面,而是更细颗粒度地给你提供一个答案,这是我们说的AI往下发展的方向。

Q:商业模式上呢?

王小川:第一步,如果搜索服务更加聪明,它就会像顾问一样,提供更好的服务,本身就能在商业上增值。

再看垂直领域,搜狗优先发展医疗健康和法律相关的这种问答服务。你咨询这方面问题,机器可以跟你对话、理解,最后给你提供统计数据和更多建议。

所以商业模式,我觉得未来有机会走向用户付费问答,因为它变成一个私人的法律顾问或者你的私人医生了。我们这次也在乌镇让大家体验搜狗明医和搜狗大律师。

Q:怎么看搜狗上市以来股价比较低迷?

王小川:上市还不到一个月,我们对搜狗的信心是长期的。上市以后,我们一次财报都还没发,市场处于真空期,美国人对搜狗的模式也不了解,比如输入法,跟他们沟通的时候就感受不到"质感"。

我觉得等到发个三次财报,才会有不断建立起来的信任和认可。

Q:上市之后,两大股东(搜狐和腾讯),对你会有什么进一步期待吗?

王小川:有期待。IPO上市完了,你有更多资本可以投入,所以业务突破的期待肯定有。比如搜索领域竞争,会更加白热化,会有更多短兵相接的竞争。输入法也会开发出相对应的模式,突破中也免不了竞争。

战略

Q:面向AI,搜狗的业务布局是什么?

王小川:搜狗的AI战略以语言为核心。

第一部分是人机交互。语言有两层含义:一,人的表达能转换成机器语言,属于感知和认知的交界点。感知靠眼睛、耳朵,认知靠语言承载的思考和知识。所以感知和认知,搜狗都会发展。这次你们看到我们提供唇语识别机器——没有声音,光看嘴唇运动就行,这是搜狗人机交互的一部分。

这部分的反向业务,我们会做语音合成,合成个性化语音,甚至个性化表情。最后机器说话完全是虚拟的,和你表情和语音一样,这部分叫自然交互。

第二部分以语言为核心。围绕机器阅读理解和推理能力,我们称为知识计算。刚才说了搜狗明医和搜狗大律师,都是知识计算,通过语言为核心的自然交互和知识计算,使人和机器进行对话,并且它能够提供给你更深刻的答案。

另外,上市前我们聚焦在搜索,上市后我们会有更多力量投入输入法智能升级。我们要让输入法变得跟你秘书一样,可以帮你更好表达。

举个例子,搜狗IPO,有4000多人给我发微信祝贺,我要一个个回答,那能不能更简单点?针对每个人,输入法就会帮我生成合适的回复内容?所以输入法会更加聪明,不只是打字和语音输入的工具,往下发展要有大突破。

Q:像秘书一样的输入法,和"AI助手"有什么区别?

王小川:助手站在你的对立面,回答你的问题。输入法和你一起,帮助你回答别人的问题。

Q:除了搜索、输入法,AI还会应用在哪些方面?

王小川:首先,不可能应用到所有市场,而且我们也要保持专注。

其次,搜狗的核心逻辑是:以语言处理为核心,不管是输入法还是搜索引擎,语言处理是弱人工智能到强人工智能的巨大纽带,因为语言里包含了人的知识和思考。

所以我们认为用AI去辅助我们的搜索和输入,站在信息获取和表达的场景,就有巨大的广阔的市场,所以当我们重新定义输入法和搜索的时候,就已经有很大的空间,并不强求做别人擅长的事情。

Q:机器翻译的进展非常快,竞争也很激烈,搜狗的竞争力是?

王小川:我们去年在乌镇发布机器同声传译,我认为搜狗在行业中处于比较领先的位置。今年我们不只提供字幕形式的同声传译,还能提供多声道语音,甚至可以合成。

所以我们不仅在做翻译、合成,也在尝试个性化。你说中文,实时就有你口音的英文,这更利于情感交流。但机器翻译更重要的是应用场景,我们有搜狗输入法,目前已经内置翻译,你可以和外国人无障碍沟通——即便你输入中文,他输入英文。

搜狗搜索也是全球首家支持跨语言检索的搜索引擎,(微软Bing在今年乌镇也宣布推出类似功能),这意味着你输入中文,就能检索全球英文信息。这就是我们的落地场景优势。

(大会演讲中,王小川发布了一个TTS合成的说英语的"王小川"。)

Q:有些公司通过投资进行AI布局,搜狗呢?

王小川:我们国内会投一些拥有数据的公司,比如医疗数据、机器翻译数据之类的,都在布局,暂时还不会对外宣布。

AI硬件

Q:上市前你谈到过AI智能硬件,音箱这样的品类会做吗?

王小川:我们的核心是服务智能性,交互智能只是一部分,但最后一定要看交付用户的服务是什么?智能音箱,如果服务本身是播音乐,那版权都在腾讯和阿里手里,所以不能只看前端交互,要看服务本身拥有的比例。

搜索问答的内容,跟搜狗契合,但不见得要在音箱上做,因为用户需求不会因为你有音箱了频率就提升。

Q:那硬件的想象集中在什么地方?

王小川:AI硬件,一定要跟你的场景高度匹配,比如我有翻译能力,我有车载语音和地图的能力,所以翻译机、车机,可能是我们的落地点,音箱不是。

语音OS?不存在的

Q:现在AI是风口,不拥抱是不是会掉队?中小公司在AI方面的挑战是什么?

王小川:世界上不一定只有AI这一件事。比如内容创作就经久不衰,所以不要因为AI概念而改变你的业务,不值当。有些创业公司啥也不懂就冲进去,很危险。也没必要焦虑,可以做点自己擅长的事情。

中小公司搞AI,相对困难一些,因为AI需要大的数据,所以如果一些小公司搞AI,有算法有技术还不够,还需要在数据方面更多合作,而不是独立发展AI技术。

Q:另一个AI的高频词汇是"赋能",你认为赋能的条件和标准是什么?

王小川:赋能其他公司吗?我觉得我们还做不到,搜狗把自己管好就不错了。

我们有2B的业务,也是基于场景把需求做好,然后做回数据,巩固主线业务,当护城河来看的,而不是赋能别的公司。

Q:那别人要是真搞出个语音交互时代的Windows?

王小川:没有这样的东西。

Q:你认为语音OS不会成真?

王小川:所以我们也要搞个GouerOS?我不搞,我觉得不存在这个东西。

女朋友

Q:你之前说搜狗不上市就不找女朋友,现在搜狗上市了……

王小川:我声明我没说过。我说过"搜狗就是我老婆",但其他的就不知道怎么演绎出来了。

Q:没有这样想过?

王小川:也没有。

Q:你妈也不催你吗?

王小川:哈哈哈哈。

Q:为什么说"搜狗是我老婆"这样的话?

王小川:我只是觉得上市前需要有很大的责任在公司里,之前有一些同事离开,我非常焦虑,觉得人家信任而来,最后失望而走。后来我想开了,离职很正常。

但新的焦虑也出现了,那些留下来的人,继续相信你的人,你不能辜负。所以我需要把很多精力放在公司里,确保对他们有很好的交代。

搜狗上市,是对这14年很好的总结。我现在能够分一些时间给自己了。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者



via 量子位 - 知乎专栏 http://ift.tt/2AQWsKY
RSS Feed

RSS5

IFTTT

缄默期过后6小时,搜狗王小川回应一切(他说:会叫的狗不咬人)

李根 发自 乌镇米仓量子位 报道 | 公众号 QbitAI

北京时间12月4日下午13点,纽约时间12月4日午夜0点。搜狗上市缄默期正式结束,王小川可以"说话"了。

6个小时后,在世界互联网大会召开地乌镇,在暮光向晚中,在一小时的时间里,搜狗CEO密集回答了各种问题。

比如上市路演时被核心关注的问题、华尔街如何看来自中国的AI故事、搜狗未来的战略航向、上市后的股价、与百度的竞争、和搜狐腾讯的关系、涉足哪些AI智能硬件,以及"不上市就不结婚"……

这也算是王小川"回应一切"。

竞争

Q:上市时说要"重新定义搜索引擎",是要颠覆百度独大的格局吗?

王小川:颠覆市场格局主要有三件事情:一,竞争对手确实做得不够好。二,需要有一些跨代领先的技术。三,要和我们的一些核心能力匹配。

只有这三件事情同时满足的时候,我们才能重新定义搜索,比竞争对手做得更好。搜狗会展现出技术能力和产品创新力。

Q:百度如今All in AI,未来是否还要和这个老对手激烈竞争?

王小川:会叫的狗不咬人。我们对手每年都宣布新战略,我们面对这样的对手,并不感到害怕。

其次,我们战略方向很清晰,之前只有对方1/10甚至更少的人,但我们取得的实际应用的创新和突破要更多。

Q:不担心AI投入上不如百度吗?

王小川:历史证明,我们即便投入没有对手多,也比他们跑得快。包括现在,我们的语音识别,是对方数倍。

机器翻译,我们是首家发布同声传译系统的公司,也是全球唯一一个能够把翻译和搜索整合在一起做跨语言检索的公司,所以在AI技术里我们是领先的。

Q:数倍?

王小川:我指的的是语音识别的量,数倍,就不止两倍。

Q:现在AI投入产出悬殊很大,上市后如何平衡短期利益和长期利益?

王小川:我觉得搜索本身就是AI落地的一个好场景。随着AI发展,搜索会变成一种问答服务,它是渐变的,也许一开始5%的问题能够直接回答,未来10%或者15%,或者更多。

或者在垂直领域,比如医疗法律里做得更好,所以本身带来商业模式的向前发展。因此在这里面,我们的每一份投入都是能产生回报的。

Q:现在就会对营收效益有提升吗?

王小川:会啊,你搜索结果更准确,大家就会都用你,商业模式已经很清楚了。另外,用户体验提升也是我们的方向,翻译、唇语识别,有些项目带有情怀性,有些是主动战略匹配。

在这些方面继续往前走,我们可以提供更多有想象力的黑科技产品,能够持续提供惊喜。所以我们短期投入有保障,搜狗也是盈利公司,有力量投入到更多场景中。

IPO

Q:搜狗是中国首家AI概念上市的公司,华尔街最关注什么?

王小川:很多人问,未来搜索会不会进入到语音搜索?或者未来输入法是不是语音输入?我告诉他们,其实这还不具有足够多的想象力。

用语音进行输入是更方便,但还不够智能,比如你用语音说一个搜狗或者用文字敲一个搜狗,搜索引擎给你的答案都是相近或者一样的。

接下来,真正厉害的地方是机器在自然语言里产生阅读能力,未来我们提问,它最后不是给你十个链接和十个页面,而是更细颗粒度地给你提供一个答案,这是我们说的AI往下发展的方向。

Q:商业模式上呢?

王小川:第一步,如果搜索服务更加聪明,它就会像顾问一样,提供更好的服务,本身就能在商业上增值。

再看垂直领域,搜狗优先发展医疗健康和法律相关的这种问答服务。你咨询这方面问题,机器可以跟你对话、理解,最后给你提供统计数据和更多建议。

所以商业模式,我觉得未来有机会走向用户付费问答,因为它变成一个私人的法律顾问或者你的私人医生了。我们这次也在乌镇让大家体验搜狗明医和搜狗大律师。

Q:怎么看搜狗上市以来股价比较低迷?

王小川:上市还不到一个月,我们对搜狗的信心是长期的。上市以后,我们一次财报都还没发,市场处于真空期,美国人对搜狗的模式也不了解,比如输入法,跟他们沟通的时候就感受不到"质感"。

我觉得等到发个三次财报,才会有不断建立起来的信任和认可。

Q:上市之后,两大股东(搜狐和腾讯),对你会有什么进一步期待吗?

王小川:有期待。IPO上市完了,你有更多资本可以投入,所以业务突破的期待肯定有。比如搜索领域竞争,会更加白热化,会有更多短兵相接的竞争。输入法也会开发出相对应的模式,突破中也免不了竞争。

战略

Q:面向AI,搜狗的业务布局是什么?

王小川:搜狗的AI战略以语言为核心。

第一部分是人机交互。语言有两层含义:一,人的表达能转换成机器语言,属于感知和认知的交界点。感知靠眼睛、耳朵,认知靠语言承载的思考和知识。所以感知和认知,搜狗都会发展。这次你们看到我们提供唇语识别机器——没有声音,光看嘴唇运动就行,这是搜狗人机交互的一部分。

这部分的反向业务,我们会做语音合成,合成个性化语音,甚至个性化表情。最后机器说话完全是虚拟的,和你表情和语音一样,这部分叫自然交互。

第二部分以语言为核心。围绕机器阅读理解和推理能力,我们称为知识计算。刚才说了搜狗明医和搜狗大律师,都是知识计算,通过语言为核心的自然交互和知识计算,使人和机器进行对话,并且它能够提供给你更深刻的答案。

另外,上市前我们聚焦在搜索,上市后我们会有更多力量投入输入法智能升级。我们要让输入法变得跟你秘书一样,可以帮你更好表达。

举个例子,搜狗IPO,有4000多人给我发微信祝贺,我要一个个回答,那能不能更简单点?针对每个人,输入法就会帮我生成合适的回复内容?所以输入法会更加聪明,不只是打字和语音输入的工具,往下发展要有大突破。

Q:像秘书一样的输入法,和"AI助手"有什么区别?

王小川:助手站在你的对立面,回答你的问题。输入法和你一起,帮助你回答别人的问题。

Q:除了搜索、输入法,AI还会应用在哪些方面?

王小川:首先,不可能应用到所有市场,而且我们也要保持专注。

其次,搜狗的核心逻辑是:以语言处理为核心,不管是输入法还是搜索引擎,语言处理是弱人工智能到强人工智能的巨大纽带,因为语言里包含了人的知识和思考。

所以我们认为用AI去辅助我们的搜索和输入,站在信息获取和表达的场景,就有巨大的广阔的市场,所以当我们重新定义输入法和搜索的时候,就已经有很大的空间,并不强求做别人擅长的事情。

Q:机器翻译的进展非常快,竞争也很激烈,搜狗的竞争力是?

王小川:我们去年在乌镇发布机器同声传译,我认为搜狗在行业中处于比较领先的位置。今年我们不只提供字幕形式的同声传译,还能提供多声道语音,甚至可以合成。

所以我们不仅在做翻译、合成,也在尝试个性化。你说中文,实时就有你口音的英文,这更利于情感交流。但机器翻译更重要的是应用场景,我们有搜狗输入法,目前已经内置翻译,你可以和外国人无障碍沟通——即便你输入中文,他输入英文。

搜狗搜索也是全球首家支持跨语言检索的搜索引擎,(微软Bing在今年乌镇也宣布推出类似功能),这意味着你输入中文,就能检索全球英文信息。这就是我们的落地场景优势。

(大会演讲中,王小川发布了一个TTS合成的说英语的"王小川"。)

Q:有些公司通过投资进行AI布局,搜狗呢?

王小川:我们国内会投一些拥有数据的公司,比如医疗数据、机器翻译数据之类的,都在布局,暂时还不会对外宣布。

AI硬件

Q:上市前你谈到过AI智能硬件,音箱这样的品类会做吗?

王小川:我们的核心是服务智能性,交互智能只是一部分,但最后一定要看交付用户的服务是什么?智能音箱,如果服务本身是播音乐,那版权都在腾讯和阿里手里,所以不能只看前端交互,要看服务本身拥有的比例。

搜索问答的内容,跟搜狗契合,但不见得要在音箱上做,因为用户需求不会因为你有音箱了频率就提升。

Q:那硬件的想象集中在什么地方?

王小川:AI硬件,一定要跟你的场景高度匹配,比如我有翻译能力,我有车载语音和地图的能力,所以翻译机、车机,可能是我们的落地点,音箱不是。

语音OS?不存在的

Q:现在AI是风口,不拥抱是不是会掉队?中小公司在AI方面的挑战是什么?

王小川:世界上不一定只有AI这一件事。比如内容创作就经久不衰,所以不要因为AI概念而改变你的业务,不值当。有些创业公司啥也不懂就冲进去,很危险。也没必要焦虑,可以做点自己擅长的事情。

中小公司搞AI,相对困难一些,因为AI需要大的数据,所以如果一些小公司搞AI,有算法有技术还不够,还需要在数据方面更多合作,而不是独立发展AI技术。

Q:另一个AI的高频词汇是"赋能",你认为赋能的条件和标准是什么?

王小川:赋能其他公司吗?我觉得我们还做不到,搜狗把自己管好就不错了。

我们有2B的业务,也是基于场景把需求做好,然后做回数据,巩固主线业务,当护城河来看的,而不是赋能别的公司。

Q:那别人要是真搞出个语音交互时代的Windows?

王小川:没有这样的东西。

Q:你认为语音OS不会成真?

王小川:所以我们也要搞个GouerOS?我不搞,我觉得不存在这个东西。

女朋友

Q:你之前说搜狗不上市就不找女朋友,现在搜狗上市了……

王小川:我声明我没说过。我说过"搜狗就是我老婆",但其他的就不知道怎么演绎出来了。

Q:没有这样想过?

王小川:也没有。

Q:你妈也不催你吗?

王小川:哈哈哈哈。

Q:为什么说"搜狗是我老婆"这样的话?

王小川:我只是觉得上市前需要有很大的责任在公司里,之前有一些同事离开,我非常焦虑,觉得人家信任而来,最后失望而走。后来我想开了,离职很正常。

但新的焦虑也出现了,那些留下来的人,继续相信你的人,你不能辜负。所以我需要把很多精力放在公司里,确保对他们有很好的交代。

搜狗上市,是对这14年很好的总结。我现在能够分一些时间给自己了。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者



via 量子位 - 知乎专栏 http://ift.tt/2AQWsKY
RSS Feed

RSS5

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...