推荐领域数据集-白红宇

推荐领域数据集

阅读量：6430 次

发布时间：2019-06-23

本文共 1163 字，大约阅读时间需要 3 分钟。

转自：http://blog.csdn.net/dajunxing/article/details/51357132，感谢分享！

Movielens Dataset：

其中Movielens-100k和movielens-1M有用户对电影的打分，电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。

HetRec2011 Dataset：包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中，电影的信息更加丰富了，有IMDB和Rotten Tomatoes的信息，具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息，当然还有打分信息。

在delicious-2k中，是用户对bookmark（书签）的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。

在last.fm-2k中，是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息（有weight）、用户对艺术家的tag信息、艺术家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用户对书的打分信息，用户城市、用户年龄、书在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

(下图摘自论文Recommender System Survey)

Flixster Dataset: 用户对电影的打分以及用户的friendship信息。

Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。

Yelp Dataset:

Bibsonomy Dataset: 与delicious类似。

Foursquare Dataset：Location-based 推荐。

Epinions and Ciao Dataset：

另外还有一些社交网络分析的数据集

以上转自：http://www.cnblogs.com/startover/p/3261476.html

A Collection of Recommendation Data Sets & data sets crawled and used in our research work

、、、、、、、、

http://www.librec/datasets.html

转载于:https://www.cnblogs.com/baiting/p/7106854.html

你可能感兴趣的文章