兴趣 主题 字段 二值化 多值并列属性 拆分 二值化
兴趣 主题 字段 二值化 多值并列属性 拆分 二值化
• 兴 趣 类 目(interest): 由 不 同 数 据 源 挖 掘 得 到 的 5 个 特 征 组, 分 别 以
interest1, interest2, interest3, interest4, interest5 表示,每个兴趣特征组包
含若干个兴趣 ID
• 关键词(keyword):较兴趣类目更细粒度地表示用户喜好,由不同数据源挖
掘得到的 3 个特征组,分别以 kw1, kw2, kw3 表示,每个关键词特征组包含若
干用户感兴趣的关键词
• 主题(topic):使用 LDA 挖掘的用户喜好主题,由不同数据源挖掘得到的 3
个特征组,分别以 topic1, topic2, topic3 表示
SELECT DISTINCT(marriageStatus) FROM myu_copy;
11
5 13
13 10
10
15
0
13 15
12 13
13
6 13
2 13
13 9
6 13 9
2 13 9
5 13 9
12 13 9
14
12 13 10
3
15 10
8
6 13 10
5 13 10
13 10 9
13 15 10
2 13 10