近期,skymind.ai 发布了一份非常全面的开源数据集。内容包括生物识别、自然图像以及深度学习图像等数据集,现机器之心将其整理如下:(内附链接哦~)
最近新增数据集
自然图像数据集
Caltech 101:101 类物体的图片。 地址:https://ift.tt/K6xaut
MS COCO:通用图像理解/说明,有关联竞赛。 地址:http://mscoco.org/
地理空间数据
————————我是深度学习图像的分割线————————
人工数据集
人脸数据集
FERET:面部识别技术数据库。 地址:https://ift.tt/XgUHHZ
————————我是深度学习视频的分割线————————
视频数据集
文本数据集
文本分类数据集:来自 Zhang et al., 2015。用于文本分类的八个数据集合集。这些是用于新文本分类基线的基准。样本大小从 120K 至 3.6M 不等,范围从二进制到 14 个分类问题。数据集来自 DBPedia、亚马逊、Yelp、Yahoo!和 AG。 地址:https://ift.tt/2eDg4DU
————————我是深度学习文本的分割线————————
问答数据集
情感数据集
推荐和排名系统
Book-Crossing 数据集:来自 Book-Crossing 社区。包含 278,858 位用户提供的约 271,379 本书的 1,149,780 个评分。 地址:https://ift.tt/PW02WR
————————我是深度学习图表的分割线————————
网络和图形
Friendster 社交网络数据集:在变成游戏网站之前,Friendster 以朋友列表的形式为 103,750,348 名用户发布了匿名数据。 地址:https://ift.tt/1mfW85O
语音数据集
————————我是深度学习音频的分割线————————
音符音乐数据集
其它数据集
健康 &生物数据
政府&统计数据
Data USA: 最全面的可视化美国公共数据。 地址:http://datausa.io/
]]> 原文: https://ift.tt/2wIKTSQ | | 机器知心 | | Unsubscribe from these notifications or sign in to manage your Email Applets. |
没有评论:
发表评论