2018年2月23日星期五

建模数据科学家的福音:MIT系特征自动构造工具今日发布

Root 编译整理自TechCrunch & Feature Labs量子位 报道 | 公众号 QbitAI

建模数据科学家的活难度很大。

得洞察big data背后的本质,从海量复杂的原始数据中创建出有价值的特征,才能搭建出高质有效的机器学习算法。

而特征的创建要求建模数据科学家有对数据有深入的了解、极端敏感的直觉、以及扎实的行业相关知识。

即便是老司机,现阶段的人肉创建特征,还是很耗时烧脑,也不可避免会出错。

Feature Labs(特征实验室),这家打娘胎就在MIT的研究机构,致力于帮助数据科学家更快地构建机器学习算法,于今天正式成立。

Max Kanter,Feature Labs的CEO兼联合创始人,在接受TechCrunch采访时表示,该公司已经开发出一种特征自动构造的方法,帮助企业客户搭建、跑通、以及最最最重要的部署给力的机器学习产品模型。

这套特征自动构造工具,Kanter认为,是Feature Labs的王牌。

其中的"深度特征合成"(Deep Feature Synthesis)数据处理流程,可以直接从原始的关系数据集和交易数据集中(例如网站访问的用户或光放购物车不买的人),自动创建出特征,并自动转化为具有预测意义的信息。

DFS的原理→http://ift.tt/2EL92yj

这意味着,建模数据家花更少的时间,就能拿到以往掉头发熬通宵才能磨出来的特征。节省出的时间和脑子,可以用来搞明白他们需要预测什么信息,进一步改善产品模型。

特征自动构造咋用?

想小试一下效果?

可以用Feature Labs给开发者提供的开源框架,Featuretools。针对新的机器学习问题,构建小型项目的算法。

Featuretools使用指南→http://ift.tt/2ENgqsW

不过,如果想要扩大项目规模,就要购买Feature Labs提供的商用产品,有提供云服务方案,也有提供本地解决方案提,具体看客户的需求。

Feature Labs已经服务过的客户有西班牙对外银行(BBVA Bank),柯尔百货(Kohl's),NASA和美国国防部下属的国防高级研究计划局(DARPA)。

Feature Labs的前世 & 融资情况

2015年的时候,CEO Kanter在MIT计算机科学和人工智能实验室(CSAIL)工作。

之前提到的"深度特征合成"算法,就是他与老同学Kalyan Veeramachaneni、Ben Schreck在这段工作时间共同开发的。这算法强大到,在全球三项数据科学竞赛中pk掉了615个对手(总共有906个团队)。

这成绩吸引了200多家媒体的关注和报道。从中,他们看出了算法建模的市场需求。在和100多家企业沟通后,他们发现现有的问题不是ML不起作用,而是企业不知道怎么用ML。

根据这个现象,Kanter才有了打算,成立Feature Labs,并给企业几点建议:

1)这套工具适合解决以前从未解决的业务问题;2)用的数据集从来没经过ML处理;3)最重要的是,基于ML开发和部署的产品团队得对机器学习完全陌生。

Feature Labs希望合作项目能在8周内,测试好实用性和可行性,并把解决方案部署到一线的生产环境中。

正是和大量应用端的接触,和早期企业客户的大量合作,Feature Labs才有了一定的积累,推出这套特征自动构造的产品。

另外,Feature Labs还宣布,在去年3月份就拿到了150万美元的种子融资,由Flybridge Capital Partners领投,First Star Ventures和122 West Ventures跟投。

最后,附编译来源,

http://ift.tt/2ooQ3OY

https://www.featurelabs.com/blog/launching-featurelabs/

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2CE7dxf
RSS Feed

RSS5

IFTTT

没有评论:

发表评论

JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧!- InfoQ 每周精要848期

「每周精要」 NO. 848 2024/09/21 头条 HEADLINE JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧! 精选 SELECTED C++ 发布革命性提案 "借鉴"Rust...