2017年11月6日星期一

机器之心「AI00」十月榜单:卡耐基梅隆大学数位博士开创的Solvvy

We believe AI should be an extension of individual human wills and, in the spirit of liberty, as broadly and evenly distributed as possible. -OpenAI


「AI00 ,这是一个开源项目」


这不仅是一份榜单,更是一个开源项目,主要基于以下几点:


人工智能是一个复杂庞大的体系,涉及众多学科,也关乎技术、产品、行业和资本等众多要素,报告的写作团队只代表他们的专业观点,有自己的局限性,需要更多行业专家参与进来加以修正和完善。人工智能技术和行业的发展瞬息万变,而报告的制作周期较长,其中的内容和数据势必会落后于行业的最新进展,无法同时满足时效性和高质量的要求。而领域内参与者的及时更新可以解决这个问题。我们深刻地理解在没有专业用户反馈的情况下所做出报告的质量局限性,所以希望用工程界「Agile Development」的理念来对待我们的报告,不断收集专业反馈来持续提升报告质量。人工智能是一个永恒命题,我们不仅会把「100 家公司」这个主题持续做下去,还会陆续开展其他主题。这个过程需要人工智能领域不同的参与者加入进来。向 OpenAI 、「斯坦福人工智能百年研究」和「Open Source」致敬。


为此,我们邀请人工智能领域的科学家、技术专家、产业专家、专业投资人和读者加入进来,共同完成这项人工智能的长期研究。如果你对「AI00」感兴趣,可在公众号对话框回复「AI00」(注:字母 AI 加数字 00)查看本开源项目的具体参与方式。


「AI00」第一期的榜单得到了来自投资界、人工智能产业界和学界的众多反馈,我们也依此对榜单的信息作出了一些订正和调整。在前几期的榜单中,我们先后增加了 Waymo、Neurala、Graphcore、云从科技、Citadel 与 Petuum 、竹间智能、Gamalon 和 DataRobot 等公司,同时也移除了一些公司。


在新一期的榜单中,我们加入了由卡耐基梅隆大学数位博士组成的 Solvvy 公司。


下面我们将介绍 Solvvy 上榜的理由:

官网地址:https://solvvy.com/


Solvvy 总部位于 Palo Alto,创始团队由卡耐基梅隆大学博士组成,公司瞄准的是智能客服领域。Solvvy 开发了算法,用来将以自然语言表达的、可能有拼写错误的、长而复杂的用户请求进行理解和分类,处理系统能自动完成的部分,同时将需要人力协助的部分快速导流到人工客服。Solvvy 的系统能在提高客户满意度的前提下,将人工客服需求降低到原来的 20%。并且随着系统处理案例数量的增多,系统的处理能力也在不断加强。公司计划在五年内实现以自动化解决 90% 客服请求的目标。截止目前,该公司已完成 1200 万美元的 A 轮融资,由 Scale Venture Partners 领投,包括 Pear Ventures,Signatures Capital 和 True Ventures 在内的全部种子轮投资者跟投。


以下为 AI00 十月榜单:


1. 语音和自然语言处理


公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
搜狗 中国 人工智能综合研究 搜索引擎、知识图谱、输入法、语音交互产品等 估值约50亿美元
X.AI 美国 自然语言处理 个性化智能助理 三轮融资共获得 3.4 亿美元
科大讯飞 中国 语音技术和自然语言处理 智能家居、车载、电信等行业解决方案 市值约 393 亿人民币
思必驰 中国 智能语音交互和自然对话 车载、智能家居和智能机器人等智能硬件的语音交互服务 B 轮:2 亿人民币
大象声科 中 / 美 声源分离、声音增强、声纹识别、麦克风阵列 会议转录,通讯,机器人,智能家居,虚拟现实,增强现实,混合现实 未透露

竹间智能 中国 情感对话机器人、语音情感技术、多模态情感识别 竹间个人助理机器人小影、金融机器人、客服机器人 2500万美元融资
TalkIQ 美国 语音识别技术、自然语言处理技术(NLP) 电话语言反馈、预测销售结果、自动信息检索 1400万美元的A轮融资
Solvvy  美国 智能客服 理解和分类用户请求 1200万美元的A轮融资


2. 计算机视觉 

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Clarifai 美国 计算机视觉 图像及视频识别 API B 轮: 3000 万美元
Affectiva 美国 计算机视觉和深度学习 实时面部表情分析和情绪识别解决方案 四轮融资共获得 3372 万美元
ViSenze 新加坡 计算机视觉、视觉搜索、图像识别 电子商务、移动商务、 在线广告等图像识别解决方案 两轮融资共获得 1400 万美元
Ditto 
Labs
英国 计算机视觉、视觉搜索、图像识别 数字媒体、广告营销、社交图片识别分析 四轮共获得 968 万美元
Orbital 
Insight
美国 计算机视觉、深度学习和数据科学 分析海量卫星图像,用于经济趋势分析和公益研究 三轮融资共 2870 万美元
Planet 
Labs
美国 计算机视觉和数据科学 将卫星图像识别用于农业、城市规划和灾害响应等 2015 年 5 月融资 1830 万美元
Descartes
Labs
美国 计算机视觉和深度学习 通过 DLFP 平台为农业提供数据分析和预测的解决方案 三轮融资共 828 万美元
商汤科技 中国 计算机视觉和深度学习 人脸识别、危险品识别、行为检测、车辆检测等的安防监控系统 4.1亿美元最新融资
旷视科技 中国 计算机视觉和深度学习 Face++ 人脸识别云服务平台、Image++ 图像识别平台、VisionHacker 移动游戏工作室 C轮4.6亿美元融资
依图科技 中国 计算机视觉和深度学习 基于图像理解的信息获取和人机交互服务 3.8亿元C轮融资
图普科技 中国 计算机视觉和深度学习 图像识别、视频鉴黄、智能审核、图片增值等云服务 新一轮千万美元融资
Neurala 波士顿 深度学习、计算机视觉 帮助机器人和智能设备学习和适应环境的软件 A 轮融资约1400 万美元
云从科技 中国 人脸识别、计算机视觉 金融机构人脸识别应用、公安系统实时布控、追逃等 天使轮 6000 万人民币


3. 芯片和硬件

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Wave
Computing
美国 深度学习芯片架构 DPU (Dataflow Processing Unit) 3轮融资共5900万美元
Ceva 美国 人工智能芯片技术 用于机器学习的第二代神经网络软件框架 CDNN2 纳斯达克上市,市值 9.12 亿美元
Tera
Deep
美国 基于 FPGA,针对于服务器端的高性能深度学习平台 被移动设备直接嵌入的深度学习模块 未透露
寒武纪科技 中国 深度学习 中国首款神经网络处理器 1亿美元 A 轮融资
深鉴科技 中国 深度学习 DPU 平台 深度学习 DPU 平台 A+轮约4000万美元融资
Graphcore 英国 深度学习硬件和软件开发 开源软件框架 Poplar 和「智能处理器」IPU A 轮融资 3000 万美元

Groq 美国 深度学习硬件、芯片 暂无信息

1030 万美元融资


4. 智能机器

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
ABB 
Robotics
瑞士 机器人及自动化技术 工业机器人、智能设备 468.95 亿美元市值
Fanuc 日本 机器人及自动化技术 工业机器人 4.4兆日元市值
KUKA 
Robotics
德国 机器人及自动化技术 工业机器人 美的 272 亿美元拿下库卡 94.55% 的股份
Rethink
Robotics
美国 机器人、人机交互 智能机器人 1800万美元新一轮融资
Universal
Robots
丹麦 机器人及自动化技术 工业机器人 未透露
3D Robotics 美国 计算机视觉、机器人技术 无人机,软件服务 五轮融资超 1 亿 2 千 600 万美元
Cyberdyne 日本 可穿戴设备 医疗助理机器人 2083.56 亿日元市值
iRobot 美国 计算机视觉、机器人技术 电子产品,家用机器人 27亿美元市值
ReWalk
Robotics
德国 计算机视觉、机器人技术 代步机器人,残障专用智能设备 2000万美元市值
Dyson 英国 智能机器,自动视觉定位及室内地图构建 清洁机器人 未透露
新松机器人 中国 机器人及自动化技术 工业机器人和行业解决方案 约 289 亿市值
埃夫特
机器人
中国 机器人 工业机器人、智能装备和行业解决方案 未透露
大疆 中国 计算机视觉、无人机控制、环境及障碍感知、视觉跟随、自动寻路 无人机航拍和图像传输 估值约100亿美元


5. 医疗

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Arterys 美国 深度学习系统生成医疗图像 深度学习分析系统 Arterys System 1200 万美元 A 轮融资
Enlitic 美国 深度学习、大数据、图像检测 癌症检测系统 三轮融资共 1500 万美元
VoxelCloud(体素科技) 美国 深度学习 医疗影像分析云服务 千万美金 A 轮融资
Insilico
Medicine
美国 深度学习和大数据 癌症诊疗 1000万美元最新融资
Oncora
Medical
美国 大数据和机器学习技术 通过数据分析为放射肿瘤学家提供临床决策支持,用于个性化医疗。 两轮融资共 132 万美元
Atomwise 美国 深度学习 药物发现 种子轮 630 万美元
TwoXAR 美国 深度学习 通过药物研发平台 DUMA™来评估大型公共和私有数据集,以迅速识别药物,并对药物和疾病的匹配度按照概率进行排序。 种子轮 340 万美元
Berg 
Health
美国 深度学习 Interrogative Biology® 平台结合病人生物学和人工智能分析来进行药物发现、开发和诊断等。 未透露
Cloud
MedX
美国 机器学习、自然语言处理 拥有 MedxExchange 、MedxInsights 和 MedxCare 三款服务产品的医疗人工智能平台,提供数据、医疗洞见和健康管理服务。 融资 660 万美元
Deep
Genomics
加拿大 深度学习、基因生物学 精准医疗 种子轮 370 万美元
碳云智能 中国 大数据、人工智能 通过数据挖掘和机器分析提供个人性健康指数分析和预测。 A 轮融资近 10 亿人民币


6. 金融

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Context
Relevant
美国 数据挖掘、预测分析 本地分析软件和云服务 五轮融资 4430 万美元
Kensho
Technologies
美国 机器学习、自然语言处理、数据挖掘 金融分析辅助决策系统 B 轮融资 5000 万美元(2017 年 2 月)年2
Zest
Finance
美国 数据挖掘、机器学习 信用服务 四轮共 1.12 亿美元
Aire 英国 信用评级 金融产品的信用评级 四轮共 700 万美元
高盛 美国 数据挖掘、机器学习 AppBank、金融业务自动化 市值 867.10 亿美元
蚂蚁金服 中国 人工智能、数据挖掘 智能助理、信用评级和风险管理等应用 估值 600 亿美元
Citadel 美国 人工智能、数据挖掘 对冲基金 目前掌管至少 260 亿美元资产


7. 智能驾驶

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Waymo 美国 自动驾驶 自动驾驶汽车 谷歌无人驾驶项目开始以独立公司的身份运营
Tesla 美国 自动驾驶 电动汽车 498.35 亿美元市值
Drive.ai 美国 深度学习 自动驾驶汽车 5000 万美元B轮融资
nuTonomy 新加坡 / 美国 3D 自动驾驶技术 城市自动驾驶的算法和软件 2轮融资公1960万美元
Innoviz 
Technologies
以色列 智能 3D 传感、传感器融合和精准地图和定位等核心自动驾驶技术 物美价廉的高清晰度固态激光雷达 完成了 A 轮融资,金额高达 900 万美元
Peloton Technology 美国 雷达和专用短程通信安全系统 自动驾驶卡车 最新一轮6000万美元融资(2017 年 4 月)
SmartDrive 美国 计算机视觉、数据挖掘 交通安全和表现的智能解决方案 六轮融资共 1.8 亿美元
Zoox 美国 全自动驾驶 全新的自动驾驶汽车 3 轮融资共 2.9 亿美元
图森未来 中国 计算机视觉和深度学习 自动驾驶 数千万美金的B轮投资
Minieye 中国 计算机视觉、智能驾驶 辅助驾驶系统 A 轮数千万人民币
Argo AI 美国 人工智能和自动驾驶技术发 自动驾驶汽车 福特将持续注资 10 亿美元


8. 垂直应用

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Darktrace 英国 利用机器学习和独家算法来检测和响应以前未识别的网络威胁 Darktrace 的核心产品为「企业免疫系统」(EIS) 三轮共融资 1.045 亿美元
Uber 美国 自动驾驶、机器学习、数据挖掘 自动驾驶汽车、智能交通和智能出行应用 12 轮融资 87.1 亿美元,估值 660 亿美元
Airbnb 美国 机器学习 开源 AeroSolve 机器学习框架、智能助手、智能推荐、定价 9 轮共融资 20 亿 9 千万美元
Salesforce 美国 云计算、深度学习、数据处理 CRM 解决方案 市值约 638.37 亿美元
Slack 美国 机器学习 企业通讯应用,bots 平台 总融资 5.4 亿美元,估值约 38 亿美元
Sentient
Technologies
美国 人工智能、大规模分布式计算 解决复杂商业问题的综合智能系统 1.03 亿美元 C 轮融资,三轮共 1.3578 亿美元
Dataminr 美国 数据挖掘 基于社交网络的数据分析服务 1.3 亿美元 D 轮融资。五轮共 1.83 亿美元
ROSS 
Intelligence
美国 认知计算、深度学习、自然语言处理 法务研究智能辅助工具 未透露
滴滴 中国 自动驾驶、机器学习、数据挖掘 自动驾驶汽车、智能交通和智能出行应用 超55亿美元新一轮融资 (2017 年 4 月)
今日头条 中国 深度学习、自然语言处理、图像识别 媒体产品的应用 估值约 120 亿美元
地平线机器人 中国 基于云端的深度神经网络算法、图像、语音、自然语言理解和运动控制、技术集成 智能机器解决方案 A+ 轮近美元
Cylance 美国 机器学习、数学科学 使用人工智能来预防网络攻击 已融资 1.77 亿美元
Sift Science 美国 机器学习 利用人工智能/机器学习来开发网络安全应用的公司 4 轮共 5360 万美元融资
SparkCognition 美国 机器学习、人工智能、数据分析 使用机器学习和人工智能技术来分析预测网络安全漏洞与系统故障 新一轮3250万美元融资


9. 机器学习

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
DeepMind 英国 人工智能基础研究 AlphaGo、医疗健康、谷歌内部产品应用。 以 4 亿英镑(约 5.32 亿美元)被谷歌收购
Vicarious 美国 人工智能基础研究 新的计算机视觉系统,机器人视觉 五轮获得 7200 万美元融资
Bonsai 美国 深度学习 Inkling 脚本语言和集成开发环境 Mastermind 760 万美元A轮融资
Preferred
Networks
日本 深度学习 深度学习操作系统 Chainer,机器学习在物联网的应用 三轮融资共 1730 万美元
Skymind 美国 深度学习 深度学习企业应用包 SKIL、开源框架 Deeplearning4j 种子轮融资 300 万美元
H2O.ai 美国 机器学习 开源机器学习平台和商业化支持 四轮融资 3360 万美元
Uptake 美国 数据挖掘、机器学习 为铁路、建筑等大行业提供数据预测分析 SaaS 服务 B轮融资5000万美元(2017 年 4 月)
Indico 美国 机器学习 为数据科学家提供图像、文本的识别和分析的工具 4轮融资共 438 万美元
第四范式 中国 机器学习 金融应用和「先知」平台 A 轮:数百万美元
Gamalon 美国 机器学习 Bayesian Program Synthesis 可以自行编写代码,用最优的方法解释收集到的数据 来自 DARPA 的 770 万美元投资、来自 Felicis Ventures 的 450 万美元种子轮融资
DataRobot 美国 机器学习 机器学习平台公司,DataRobot 平台上有数百个开源机器学习算法 5400 万美元 C 轮融资
Petuum 美国 机器学习与人工智能平台 PetuumOS、Poseidon 框架、Petuum Healthcare Solutions 9300万美元B轮融资
Algorithmia 美国 算法 类似于苹果 App Store 的「算法应用」商店 1050 万美元 A 轮融资


10. 大公司

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
谷歌 美国 人工智能综合研究 TensorFlow 等开源框架,Google Photos、Now、Inbox 和搜索等多项产品和服务、硬件 市值 6701 亿美元
Facebook 美国 人工智能综合研究 多个开源框架和硬件平台,Messenger、社交网络和定向广告等多项产品和服务 市值 4296 亿美元
亚马逊 美国 人工智能综合研究 云服务、Echo 等智能家居、机器人、电商产品应用 市值 4696 亿美元
微软 美国 人工智能综合研究 CNTK 等开源框架,Cortana、小冰等多项产业和服务,硬件 市值 5362 亿美元
IBM 美国 人工智能综合研究 Watson、行业认知计算解决方案、量子计算机等 市值 1434 亿美元
苹果 美国 人工智能综合研究 基于智能手机等硬件的多项产品和硬件、智能助手、智能家居、医疗等 市值 8067 亿美元
百度 中国 人工智能综合研究 开源框架 PaddlePaddle、百度大脑、自动驾驶、互联网应用 市值 676 亿美元
阿里巴巴 中国 人工智能综合研究 云服务、人工智能平台 DT PAI、电商产品应用 市值3079 亿美元
腾讯 中国 人工智能综合研究 互联网应用 25683.98亿人名币
NVIDIA 美国 人工智能硬件 GPU、深度学习超级计算机 DGX-1、自动驾驶超级计算机 Xavier 市值 832.07 亿美元
英特尔 美国 人工智能硬件 CPU、Xeon Phi、Nervana 市值 1706.30 亿美元
高通 美国 人工智能硬件 移动智能设备芯片 市值约 899.36 亿美元
赛灵思 美国 全可编程技术和器件 All Programmable FPGA、SoC 和 3D IC 提供商 160.70 亿美元
华为 中国 人工智能综合研究、硬件 人机交互设备应用、芯片等 2017 年以 785.108 亿美元营业收入首次打入《财富》前百强


「 AI00 开源项目」参与方式:


1)点击「阅读原文」填写表单,申请加入「AI00」开源社区,通过微信群和其他协作平台进行讨论。


2)直接在 Github 页面进行 contribute ,http://ift.tt/2dXlBql




]]> 原文: http://ift.tt/2zocXgl
RSS Feed

机器知心

IFTTT

腾讯杀入无人车战场:原型车已经搞定,系统正在内测

夏乙 发自 凹非寺量子位 出品 | 公众号 QbitAI

腾讯也入局自动驾驶了。

彭博社今天报道,有熟悉内情的消息人士称,腾讯已经开发了自己的自动驾驶系统,也杀入了这个热门领域。

量子位今年早些时候已经注意到腾讯开始低调招募自动驾驶的相关工程师。不过腾讯一直没有给出确切的回复。

据彭博报道,腾讯已经搞定了原型车,并开始在内部对这个系统进行测试。

腾讯打算利用自身在地图和人工智能上的技术储备,参与到自动驾驶汽车领域的竞争中来。

详细看来,腾讯旗下与自动驾驶沾边的业务并不少。

今年3月,腾讯买入了5%的特斯拉股票,彭博社数据显示,腾讯是这家明星电动汽车公司的第四大股东。

特斯拉还不是腾讯持股的唯一车厂。中国电动汽车公司蔚来成立初期,腾讯就成了它的投资者。蔚来汽车计划在2020年将自己的电动汽车推向美国市场。

同时,腾讯还是国内最大的网约车公司滴滴出行、地图公司四维图新的大股东。

去年12月,腾讯还和四维图新一起,入股了欧洲地图导航服务商HERE,四维图新和腾讯还分别获得了一个董事会席位和一个战略咨询委员会席位。

虽然腾讯的动向没那么清晰,但可以确定的是,四维图新在积极开发自动驾驶技术,这家公司的自动驾驶原型车已经到了可供试乘的阶段。

马化腾甚至曾在3月份公开表示,腾讯未来可能会探索AI技术在无人车上的应用。

量子位向腾讯方面求证,腾讯表示不予置评。

招聘信息透露细节

目前腾讯官方发布的招聘中,仍有16个岗位与自动驾驶直接相关。从业务归属来看,这些招聘属于MIG(移动互联网事业群),工作地点主要在北京。

从招聘信息可以看出,腾讯的自动驾驶会使用单目/双目相机、激光雷达等传感器,使用多种机器学习技术进行决策,并且还在构建高精地图,以及搭建无人车仿真系统和自动驾驶数据平台。

量子位今年7月的腾讯招聘截图

今年7月,量子位就注意到腾讯正在招聘自动驾驶人才。当时有腾讯内部人士透露,这个项目由地图团队负责。

刚才提到的16个岗位包括:

  • 自动驾驶机器人感知算法工程师
  • 自动驾驶数据平台数据工艺师
  • 自动驾驶融合定位
  • 自动驾驶深度学习
  • 自动驾驶融合感知
  • 自动驾驶机器人SLAM算法工程师
  • 自动驾驶机器人-导航算法
  • 自动驾驶高精地图-工具研发
  • 自动驾驶协调控制工程师
  • 自动驾驶模拟仿真工程师
  • 自动驾驶机器人后台开发工程师
  • 自动驾驶产品经理
  • 自动驾驶仿真模拟系统-前端开发
  • 自动驾驶数据平台高级前端开发工程师
  • 自动驾驶数据平台大数据高级系统架构师
  • 自动驾驶数据平台高级后台开发工程师

腾讯AI布局

在腾讯内部,AI被认为就是代表下一个时代制胜点的技术,如何强调都不为过,只是现在AI还处于早期发展阶段,腾讯并不希望显性地说出来。

腾讯副总裁、AI Lab和AI平台负责人姚星此前透露,腾讯有三个AI业务团队:

  • 第一个是优图实验室,隶属于腾讯社交网络事业群(SNG),专注于机器学习、模式识别,和认知技术的研究,目前成果已经在天天P图等产品中应用。
  • 第二个是微信中的AI团队,是一个主功语音识别、模式识别的工作室,最核心应用是提供微信中语音输入转文字的方式。
  • 第三个则是2016年4月正式成立的AI Lab,隶属于腾讯技术工程事业群(TEG),主要围绕图像识别、语音识别、自然语言处理和机器学习4个方向进行研究。

除了研究方向,腾讯内部对于AI的聚焦还体现在业务场景结合上,姚星介绍称,会围绕三个具体场景进行落地:

  • 一个是社交,社交是腾讯的核心,当然这是最难的,社交是认知的问题,社交是目前最难的。
  • 第二个是游戏,这是腾讯内部第一的,也是全球化互联网提AI for game,我们后续有很多在做。
  • 第三是内容推荐类的产品,内容类产品也是腾讯主要的发展方向。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2zm3owh
RSS Feed

RSS5

IFTTT

腾讯杀入无人车战场:原型车已经搞定,系统正在内测

夏乙 发自 凹非寺量子位 出品 | 公众号 QbitAI

腾讯也入局自动驾驶了。

彭博社今天报道,有熟悉内情的消息人士称,腾讯已经开发了自己的自动驾驶系统,也杀入了这个热门领域。

量子位今年早些时候已经注意到腾讯开始低调招募自动驾驶的相关工程师。不过腾讯一直没有给出确切的回复。

据彭博报道,腾讯已经搞定了原型车,并开始在内部对这个系统进行测试。

腾讯打算利用自身在地图和人工智能上的技术储备,参与到自动驾驶汽车领域的竞争中来。

详细看来,腾讯旗下与自动驾驶沾边的业务并不少。

今年3月,腾讯买入了5%的特斯拉股票,彭博社数据显示,腾讯是这家明星电动汽车公司的第四大股东。

特斯拉还不是腾讯持股的唯一车厂。中国电动汽车公司蔚来成立初期,腾讯就成了它的投资者。蔚来汽车计划在2020年将自己的电动汽车推向美国市场。

同时,腾讯还是国内最大的网约车公司滴滴出行、地图公司四维图新的大股东。

去年12月,腾讯还和四维图新一起,入股了欧洲地图导航服务商HERE,四维图新和腾讯还分别获得了一个董事会席位和一个战略咨询委员会席位。

虽然腾讯的动向没那么清晰,但可以确定的是,四维图新在积极开发自动驾驶技术,这家公司的自动驾驶原型车已经到了可供试乘的阶段。

马化腾甚至曾在3月份公开表示,腾讯未来可能会探索AI技术在无人车上的应用。

量子位向腾讯方面求证,腾讯表示不予置评。

招聘信息透露细节

目前腾讯官方发布的招聘中,仍有16个岗位与自动驾驶直接相关。从业务归属来看,这些招聘属于MIG(移动互联网事业群),工作地点主要在北京。

从招聘信息可以看出,腾讯的自动驾驶会使用单目/双目相机、激光雷达等传感器,使用多种机器学习技术进行决策,并且还在构建高精地图,以及搭建无人车仿真系统和自动驾驶数据平台。

量子位今年7月的腾讯招聘截图

今年7月,量子位就注意到腾讯正在招聘自动驾驶人才。当时有腾讯内部人士透露,这个项目由地图团队负责。

刚才提到的16个岗位包括:

  • 自动驾驶机器人感知算法工程师
  • 自动驾驶数据平台数据工艺师
  • 自动驾驶融合定位
  • 自动驾驶深度学习
  • 自动驾驶融合感知
  • 自动驾驶机器人SLAM算法工程师
  • 自动驾驶机器人-导航算法
  • 自动驾驶高精地图-工具研发
  • 自动驾驶协调控制工程师
  • 自动驾驶模拟仿真工程师
  • 自动驾驶机器人后台开发工程师
  • 自动驾驶产品经理
  • 自动驾驶仿真模拟系统-前端开发
  • 自动驾驶数据平台高级前端开发工程师
  • 自动驾驶数据平台大数据高级系统架构师
  • 自动驾驶数据平台高级后台开发工程师

腾讯AI布局

在腾讯内部,AI被认为就是代表下一个时代制胜点的技术,如何强调都不为过,只是现在AI还处于早期发展阶段,腾讯并不希望显性地说出来。

腾讯副总裁、AI Lab和AI平台负责人姚星此前透露,腾讯有三个AI业务团队:

  • 第一个是优图实验室,隶属于腾讯社交网络事业群(SNG),专注于机器学习、模式识别,和认知技术的研究,目前成果已经在天天P图等产品中应用。
  • 第二个是微信中的AI团队,是一个主功语音识别、模式识别的工作室,最核心应用是提供微信中语音输入转文字的方式。
  • 第三个则是2016年4月正式成立的AI Lab,隶属于腾讯技术工程事业群(TEG),主要围绕图像识别、语音识别、自然语言处理和机器学习4个方向进行研究。

除了研究方向,腾讯内部对于AI的聚焦还体现在业务场景结合上,姚星介绍称,会围绕三个具体场景进行落地:

  • 一个是社交,社交是腾讯的核心,当然这是最难的,社交是认知的问题,社交是目前最难的。
  • 第二个是游戏,这是腾讯内部第一的,也是全球化互联网提AI for game,我们后续有很多在做。
  • 第三是内容推荐类的产品,内容类产品也是腾讯主要的发展方向。

—完—

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2zm3owh
RSS Feed

RSS5

IFTTT

深度学习在单图像超分辨率上的应用:SRCNN、Perceptual loss、SRResNet

本文介绍了三种不同的卷积神经网络(SRCNN、Perceptual loss、SRResNet)在单图像超分辨率集上的实际应用及其表现对比,同时也探讨了其局限性和未来发展方向。


单图像超分辨率技术涉及到增加小图像的大小,同时尽可能地防止其质量下降。这一技术有着广泛用途,包括卫星和航天图像分析、医疗图像处理、压缩图像/视频增强及其他应用。我们将在本文借助三个深度学习模型解决这个问题,并讨论其局限性和可能的发展方向。


我们通过网页应用程序的形式部署开发结果,允许在自定义图像上测试文中的大多数方法,同样你也可以查看我们的实例:http://ift.tt/2AkMj61


单图像超分辨率:问题陈述


我们的目标是采用一个低分辨率图像,产生一个相应的高分辨率图像的评估。单图像超分辨率是一个逆问题:多个高分辨率图像可以从同一个低分辨率图像中生成。比如,假设我们有一个包含垂直或水平条的 2×2 像素子图像(图 1)。不管条的朝向是什么,这四个像素将对应于分辨率降低 4 倍的图像中的一个像素。通过现实中的真实图像,一个人需要解决大量相似问题,使得该任务难以解决。


图 1:从左到右依次是真值 HR 图像、相应的 LR 图像和一个训练用来最小化 MSE 损失的模型的预测。


首先,让我们先了解一个评估和对比模型的量化质量检测方法。对于每个已实现的模型,我们会计算一个通常用于测量有损压缩编解码器重建质量的指标,称之为峰值信噪比(PSNR/Peak Signal to Noise Ratio)。这一指标是超分辨率研究中使用的事实标准。它可以测量失真图像与原始高质量图像的偏离程度。在本文中,PSNR 是原始图像与其评估版本(噪声强度)之间图像(信号强度)可能的最大像素值与最大均方误差(MSE)的对数比率。


PSNR 值越大,重建效果越好,因此 PSNR 的最大值化自然会最小化目标函数 MSE。我们在三个模型中的两个上使用了该方法。在我们的实验中,我们训练模型把输入图像的分辨率提升四倍(就宽度和高度而言)。在这一因素之上,哪怕提升小图像的分辨率也变的很困难。比如,一张分辨率提升了八倍的图像,其像素数量扩大了 64 倍,因此需要另外的原始格式的 64 倍内存存储它,而这是在训练之中完成的。我们已经在文献常用的 Set5、Set14 和 BSD100 基准上测试了模型。这些文献中引用了在这些数据集上进行测试的模型的结果,使得我们可以对比我们的结果和之前作者的结果。


这些模型已在 PyTorch 做了实现(http://pytorch.org/)。


为什么选择深度学习?


提高图像分辨率的最常用技术之一是插值(interpolation)。尽管易于实现,这一方法在视觉质量方面依然有诸多不足,比如很多细节(比如尖锐的边缘)无法保留。




图 2:最常见的插值方法产生的模糊图像。自上而下依次是最近邻插值、双线性插值和双立方插值。该图像的分辨率提升了四倍。


更复杂的方法则利用给定图像的内部相似性或者使用低分辨率图像数据集及其对应的高质量图像,有效地学习二者之间的映射。在基于实例的 SR 算法中,稀疏编码方法是最为流行的方法之一。


这一方法需要找到一个词典,允许我们把低分辨率图像映射到一个中间的稀疏表征。此外,HR 词典已被学习,允许我们存储一个高分辨率图像的评估。该流程通常涉及若干个步骤,且无法全部优化。理想情况下,我们希望把这些步骤合而为一,其中所有部分皆可优化。这种效果可以通过神经网络来达到,网络架构受到稀疏编码的启发。


更多信息请参见:http://ift.tt/2iAPrTt


SRCNN


SRCNN 是超越传统方法的首个深度学习方法。它是一个卷积神经网络,包含 3 个卷积层:图像块提取与表征、非线性映射和最后的重建。


图像在馈送至网络之前需要通过双立方插值进行上采样,接着它被转化为 YCbCr 色彩空间,尽管该网络只使用亮度通道(Y)。然后,网络的输出合并已插值的 CbCr 通道,输出最终彩色图像。我们选择这一步骤是因为我们感兴趣的不是颜色变化(存储在 CbCr 通道中的信息)而只是其亮度(Y 通道);根本原因在于相较于色差,人类视觉对亮度变化更为敏感。


我们发现 SRCNN 很难训练。它对超参数的变化非常敏感,论文中展示的设置(前两层的学习率为 10-4,最后两层的学习率为 10-5,使用 SGD 优化器)导致 PyTorch 实现输出次优结果。我们观察到在不同的学习率下,输出结果有一些小的改变。最后我们发现,使性能出现大幅提升的是设置是:每层的学习率为 10-5,使用 Adam 优化器。最终网络在 1.4 万张 32×32 的子图上进行训练,图像和原始论文中的图像来自同样的数据集(91 张图像)。


图 3:左上:双立方插值,右上:SRCNN,左下:感知损失,右下:SRResNet。SRCNN、感知损失和 SRResNet 图像由对应的模型输出。


感知损失(Perceptual loss)


尽管 SRCNN 优于标准方法,但还有很多地方有待改善。如前所述,该网络不稳定,你可能会想优化 MSE 是不是最佳选择。


很明显,通过最小化 MSE 获取的图像过于平滑。(MSE 输出图像的方式类似于高分辨率图像,导致低分辨率图像,[图 1])。MSE 无法捕捉模型输出和真值图像之间的感知区别。想象一对图像,第二个复制了第一个,但是改变了几个像素。对人类来说,复制品和原版几乎无法分辨,但是即使是如此细微的改变也能使 PSNR 显著下降。


如何保存给定图像的可感知内容?神经风格迁移中也出现了类似的问题,感知损失是一个可能的解决方案。它可以优化 MSE,但不使用模型输出,你可以使用从预训练卷积神经网络中提取的高级图像特征表示(详见 http://ift.tt/2haFJaa)。这种方法的基础在于图像分类网络(如 VGG)把物体细节的信息存储在特征图中。我们想让自己提升后的图像中的物体尽可能地逼真。


除了改变损失函数,网络架构也需要重新建模。该模型比 SRCNN 深,使用残差块,在低分辨率图像上进行大部分处理(加速训练和推断)。提升也发生在网络内部。在这篇论文中(http://ift.tt/2dX2g9i),作者使用转置卷积(transposed convolution,又叫解卷积,deconvolution),3×3 卷积核,步幅为 2。该模型输出的「假」图像看起来与棋盘格滤镜效果类似。为了降低这种影响,我们还尝试了 4×4 卷积的解卷积,以及最近邻插值与 3×3 的卷积层,步幅为 1。最后,后者得到了最好的结果,但是仍然没有完全移除「假」图像。


与论文中描述的过程类似,我们的训练流程包括从 MS‑COCO 近一万张图像中抽取的一些 288×288 随机图像组成的数据集。我们将学习率设置为 10-3,使用 Adam 优化器。与上面引用的论文不同,我们跳过了后处理(直方图匹配),因为该步骤无法提供任何改进。


SRResNet


为了最大化 PSNR 性能,我们决定实现 SRResNet 网络,它在标准基准上达到了当前最佳的结果。原论文(http://ift.tt/2ctJo44)提到一种扩展方式,允许修复更高频的细节。


和上文描述的残差网络一样,SRResNet 的残差块架构基于这篇文章(http://ift.tt/1S3chkd)。存在两个小的更改:一个是 SRResNet 使用 Parametric ReLU 而不是 ReLU,ReLU 引入一个可学习参数帮助它适应性地学习部分负系数;另一个区别是 SRResNet 使用了图像上采样方法,SRResNet 使用了子像素卷积层。详见:http://ift.tt/2kM8DxR


SRResNet 生成的图像和论文中呈现的结果几乎无法区分。训练用了两天时间,训练过程中,我们使用了学习率为 10-4 的 Adam 优化器。使用的数据集包括来自 MS‑COCO 的 96×96 随机图像,与感知损失网络类似。


未来工作


还有一些适用于单图像超分辨率的有潜力的深度学习方法,但由于时间限制,我们没有一一测试。


这篇近期论文(http://ift.tt/2uu2Ip0)提到使用修改后的 SRResNet 架构获得了非常好的 PSNR 结果。作者移除残差网络中的批归一化,把残差层的数量从 16 增加到 32。然后把网络在 NVIDIA Titan Xs 上训练七天。我们通过更快的迭代和更高效的超参数调整,把 SRResNet 训练了两天就得到了结果,但是无法实现上述想法。


我们的感知损失实验证明 PSNR 可能不是一个评估超分辨率网络的合适指标。我们认为,需要在不同类型的感知损失上进行更多研究。我们查看了一些论文,但是只看到网络输出的 VGG 特征图表示和真值之间的简单 MSE。现在尚不清楚为什么 MSE(每像素损失)在这种情况中是一个好的选择。


另一个有潜力的方向是生成对抗网络。这篇论文(http://ift.tt/2ctJo44)使用 SRResNet 作为 SRGAN 架构的一部分,从而扩展了 SRResNet。该网络生成的图像包含高频细节,比如动物的皮毛。尽管这些图像看起来更加逼真,但是 PSNR 的评估数据并不是很好。




图 4:从上到下:SRResNet 实现生成的图像、SRResNet 扩展生成的图像,以及原始图像


结论


本文中,我们描述了用于单图像超分辨率的三种不同的卷积神经网络实验,下图总结了实验结果。


图 5:本文讨论模型的优缺点


使用 PSNR 在标准基准数据集上进行度量时,即使简单的三层 SRCNN 也能够打败大部分非机器学习方法。我们对感知损失的测试证明,该指标不适合评估我们的模型性能,因为:我们能够输出美观的图像,但使用 PSNR 进行评估时,竟然比双立方插值算法输出的图像差。最后,我们重新实现了 SRResNet,在基准数据集上重新输出当前最优的结果。我们构建的模型使用 Neptune 来部署,模型地址:http://ift.tt/2AkMj61


]]> 原文: http://ift.tt/2j7ApbI
RSS Feed

机器知心

IFTTT

集智 机器学习基础班(线下班)绝不包就业班

人数:8人(目前已经7人)

费用:原价8000元,11月8号前报名,享受折扣价2499元,9号前报名享受折扣价3999元。9号恢复原价。(不讲价,座位付费预定即无,不退款)报名时会简单咨询背景和编程经验。

信息扩散优惠:保存下图并发到你的朋友圈,扫码添加客服微信+发送截图给客服,可免费获得一门巨难课程《深度学习的理论基础》

性质:非就业班,救不了业,培养基础。

地址:北京市海淀区善缘街1号立方庭

日期:11月11日起的双休日,共计10天,每天6小时左右,持续五周,每周留有课堂作业。

学员编号:001-008 Basic 一期 顺利通过所有课程者,发身份铭牌+结业证书

形式:线下班。基础知识+每周作业+课后答疑+助教团队+四场AI一线公司创始人/工程师/HR主管讲座。

助教阵容:清华本科团队。

授课团队及内容:

北大博士、人大博士、中科院博士,海外双学位本硕,某AI比赛世界冠军等。(隐去姓名)



via 集智 - 知乎专栏 http://ift.tt/2zm2JuQ
RSS Feed

RSS7

IFTTT

M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」-InfoQ每周精要No.900

「每周精要」 NO. 900 2025/11/01 头条 HEADLINE M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」 精选 SELECTED a16z 将 3000 万开发者标价 3 万亿 网友:几个初创公司 + 大模型就...