博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
推荐领域数据集
阅读量:6430 次
发布时间:2019-06-23

本文共 1163 字,大约阅读时间需要 3 分钟。

转自:http://blog.csdn.net/dajunxing/article/details/51357132,感谢分享!

Movielens Dataset:

       其中Movielens-100k和movielens-1M有用户对电影的打分,电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。

HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

       在movielens-2k中,电影的信息更加丰富了,有IMDB和Rotten Tomatoes的信息,具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息,当然还有打分信息。

       在delicious-2k中,是用户对bookmark(书签)的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。

       在last.fm-2k中,是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息(有weight)、用户对艺术家的tag信息、艺术家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用户对书的打分信息,用户城市、用户年龄、书在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

 (下图摘自论文Recommender System Survey)

Flixster Dataset: 用户对电影的打分以及用户的friendship信息。 

Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。 

Yelp Dataset: 

Bibsonomy Dataset: 与delicious类似。

Foursquare Dataset:Location-based 推荐。

Epinions and Ciao Dataset:

另外还有一些社交网络分析的数据集

    

   

以上转自:http://www.cnblogs.com/startover/p/3261476.html

 

A Collection of Recommendation Data Sets  & data sets crawled and used in our research work

、、、、、、、、

http://www.librec/datasets.html

转载于:https://www.cnblogs.com/baiting/p/7106854.html

你可能感兴趣的文章
NLPIR技术助力中文智能数据挖掘
查看>>
python操作redis--------------数据库增删改查
查看>>
Android中仿IOS提示框的实现
查看>>
php初学第一课
查看>>
Windows下与Linux下编写socket程序的区别 《转载》
查看>>
java学习笔记 --- IO(3)
查看>>
Mysql 的FIND_IN_SET函数慢的忧化
查看>>
Web service是什么?
查看>>
python 问题集合
查看>>
豌豆荚工程师谈其新版应用搜索技术
查看>>
螺旋阵(递归和非递归)
查看>>
我的爷爷(知识渊博的下乡知青)
查看>>
jQuery动画连续触发、滞后反复执行解决办法
查看>>
uva 10405 Longest Common Subsequence
查看>>
HttpFileCollection类
查看>>
Eclipse使用常见设置
查看>>
控制台下的字符图像界面
查看>>
c++ 数组形参
查看>>
Memcache的安全
查看>>
KVM/Xen and libvirt: currentMemory, memory and ballooning
查看>>