behavior analysis、healthcare两类中部分论文数据集介绍
1、Depression Intensity Estimation via Social Media: A Deep Learning Approach(通过社交媒体估计抑郁强度:一种深度学习方法)
数据集大小:205G
数据集介绍:Twitter用户及推文,该数据集由总共 6562 个用户组成,其中 1402 个被标记为抑郁,5160 个被 标记为非抑郁,以及总共 4 245 747 条推文,其中 292 564 条为抑郁用户,3 953 183 条为非抑郁用户
数据集链接:
https://mailstsinghuaeducn-my.sharepoint.com/personal/sgy16_mails_tsinghua_edu_cn/_layouts/15/onedrive.aspx?id=%2Fpersonal%2Fsgy16_mails_tsinghua_edu_cn%2FDocuments%2FData%2FDataset.zip&parent=%2Fpersonal%2Fsgy16_mails_tsinghua_edu_cn%2FDocuments%2FData&ga=1
2、The Deep Features and Attention Mechanism-Based Method to Dish Healthcare Under Social IoT Systems: An Empirical Study With a Hand-Deep Local–Global Net(基于深度特征和注意力机制的社交物联网下的医疗服务推送方法:基于手-深局部-全球网络的实证研究)
数据集大小:31.1M
数据集介绍:ISIA food-500:用于大规模食品识别的数据集(原文指出采用这个数据集进行训练)500个类别和不到40万的图片 食物识别数据集
数据集链接:
http://123.57.42.89/Dataset_ict/ISIA_Food500_Dir/dataset/
3、Latent Personality Traits Assessment From Social Network Activity Using Contextual Language Embedding(基于语境语言嵌入的社交网络活动潜在人格特征评估)
数据集大小:59.9M
数据集介绍:该数据集包含超过 8600 行数据,每行是一个人的:
类型(此人的 4 个字母 MBTI 代码/类型)
他们发布的最后 50 条内容的一部分(每个条目由“|||”分隔(3 个竖线字符))
The Myers Briggs Type Indicator (or MBTI for short) is a personality type system that divides everyone into 16 distinct personality types across 4 axis:
Introversion (I) – Extroversion (E)
Intuition (N) – Sensing (S)
Thinking (T) – Feeling (F)
Judging (J) – Perceiving (P)
数据集链接:https://www.kaggle.com/datasets/datasnaek/mbti-type
4、Next and Next New POI Recommendation via Latent Behavior Pattern Inference(基于潜在行为模式推理的Next和Next New POI推荐)
数据集大小:376M
数据集介绍: Foursquare 洛杉矶和 Foursquare 纽约市的两个LBSNs 大规模签到数据集 该 数据 集包 括 由 纽约 的 49, 062 名 用户 生成 的 221, 128 条 提示 和由 洛杉 矶 的 31 ,544 名用 户 生 成 的 104,478 条提示。同时,包含在其他城 市收集这些用户的建议。收集数据时会记录以下信息: 1) 用户配置文件信息,包括用户 ID、姓名和所在城市;2)场 馆简介信息,包括场馆 ID、名称、地址、GPS 坐标及其类 别;以及 3)用户位置历史,由用户留在系统中的所有提示表示。
LBSNs签到:用户标记地点(例如, 餐馆)并在他到达那里时留下一些评论。
数据集链接:
https://www.dropbox.com/s/4nwb7zpsj25ibyh/check-in data.zip
5、When Sentiment Analysis Meets Social Network: A Holistic User Behavior Modeling in Opinionated Data(当情感分析遇到社交网络:一种基于观点数据的整体用户行为模型)
数据集大小:323M
数据集介绍:Amazon和Yelp两个评论数据集,数据集中每个用户都与一组评论相关联,每个评论都包含各种属性,如作者 ID、评论ID、时间戳、文本内容和离散五星范围内的意见评级。Yelp 数据集提供了从用户的 Facebook 好友关系中导入的用户友谊,而Amazon集中没有显式的社交网络。我们 利用“共同购买”信息为亚马逊用户建立网络结构。(原文开发了一个概率生成模型来整合用户的两个伴随学习任务:观点内容建模和社会网络结构建模)
-------------------------------------------
个性签名:独学而无友,则孤陋而寡闻。做一个灵魂有趣的人!
如果觉得这篇文章对你有小小的帮助的话,记得在右下角点个“推荐”哦,博主在此感谢!