微博数据调研
1.新浪微博基于MySQL的分布式数据库实践
http://tech.it168.com/a2011/0415/1178/000001178546.shtml
2.新浪微博,腾讯微博mysql数据库主表猜想*
http://blog.csdn.net/cleanfield/article/details/6339428
3.百度学术:基于Hadoop的微博舆情分析预警系统研究
http://xueshu.baidu.com/s?wd=+基于Hadoop的微博舆情分析预警系统研究+&rsv_bp=0&tn=SE_baiduxueshu_c1gjeupa&rsv_spt=3&ie=utf-8&f=8&rsv_sug2=0&rsv_n=2
4.新浪微博数据挖掘食谱
http://blog.csdn.net/guaguastd/article/category/2801483
“关注”是指你去关注他人,做他人的粉丝。而你的“粉丝”就是关注你的人。所以二者是关注与被关注的关系,好友圈一定要是互相关注的关系才可以的.
{"user": 作者信息 {"bi_followers_count": 366, 用户的互粉数 "domain": "", 用户的个性化域名 "avatar_large": "http://tp4.sinaimg.cn/1771566731/180/5601401086/0", 用户头像地址(大图),180×180像素 "ptype": 0, "block_word": 0, "star": 0, "id": 1771566731, 用户UID "city": "1000", 用户所在城市ID "verified": false, 是否是微博认证用户,即加V用户 "block_app": 0, "follow_me": false, 该用户是否关注当前登录用户 "verified_reason": "", 认证原因 "followers_count": 395, 粉丝数 "location": "\u6d77\u5916", 用户所在地 "mbtype": 0, "profile_url": "u/1771566731", 用户的微博统一URL地址 "province": "400", 用户所在省级ID "avatar_hd": "http://tp4.sinaimg.cn/1771566731/180/5601401086/0", 用户头像地址(高清),高清头像原图 "statuses_count": 271, 微博数 "description": "\u767e\u5206\u767e\u5c04\u624b\u5ea7", 用户个人描述 "friends_count": 977, 关注数 "online_status": 1, 用户的在线状态,0:不在线、1:在线 "mbrank": 0, "allow_all_act_msg": false, 是否允许所有人给我发私信 "profile_image_url": "http://tp4.sinaimg.cn/1771566731/50/5601401086/0", 用户头像地址(中图),50×50像素 "idstr": "1771566731", 字符串型的用户UID "allow_all_comment": true, 是否允许所有人对我的微博进行评论,true:是,false:否 "geo_enabled": true, 是否允许标识用户的地理位置 "class": 1, "name": "DianaAnn-", 友好显示名称 "lang": "zh-cn", 用户当前的语言版本,zh-cn:简体中文,zh-tw:繁体中文,en:英语 "weihao": "", 用户的微号 "remark": "", 用户备注信息,只有在查询用户关系时才返回此字段 "favourites_count": 44, 收藏数 "screen_name": "DianaAnn-", 用户昵称 "url": "", 用户博客地址 "gender": "f", 性别,m:男、f:女、n:未知 "created_at": "Sat Jul 10 00:00:24 +0800 2010", 用户创建(注册)时间 "verified_type": -1, 暂未支持 "following": false}, 暂未支持 "favorited": false,是否已收藏,true:是,false:否 "annotations": [{元数据,主要是为了方便第三方应用记 "source": {"url": "http://huati.weibo.com/931263", 微博来源 (用户博客地址) "name": "\u8ffd\u8fc7\u7684\u6700\u4e45\u7684\u6b4c\u624b", "appid": "438"}}, {"huati": {"tid": "931263", "from": "pk"}}], "attitudes_count": 0, 表态数 "truncated": false, 是否被截断,true:是,false:否 "text": "\u4e94\u6708\u5929 ^^ \u8be6\u60c5:http://t.cn/8sMWZM9", 微博信息内容 "created_at": "Mon Mar 31 22:09:13 +0800 2014", "reposts_count": 0,转发数 "visible":{"type": 0, 微博的可见性及指定可见分组信息。该object中type取值,0:普通微博,1:私密微博,3:指定分组微博,4:密友微博; "list_id": 0}, list_id为分组的组号 "idstr": "3694307271826493", 字符串型的微博ID "mid": "3694307271826493", 评论的MID "source": "<a href=\"http://app.weibo.com/t/feed/4AbAFV\" rel\"nofollow\">\u5fae\u8bdd\u9898</a>", 评论的来源 "in_reply_to_status_id": "", (暂未支持)回复ID "mlevel": 0, 暂未支持 "in_reply_to_screen_name": "", (暂未支持)回复人昵称 "in_reply_to_user_id": "", (暂未支持)回复人UID "comments_count": 0, 评论数 "geo": null, "id": 3694307271826493, 用户UID "pic_urls": []} 返回字段说明 返回值字段 字段类型 字段说明 id int64 用户UID idstr string 字符串型的用户UID screen_name string 用户昵称 name string 友好显示名称 province int 用户所在省级ID city int 用户所在城市ID location string 用户所在地 description string 用户个人描述 url string 用户博客地址 profile_image_url string 用户头像地址(中图),50×50像素 profile_url string 用户的微博统一URL地址 domain string 用户的个性化域名 weihao string 用户的微号 gender string 性别,m:男、f:女、n:未知 followers_count int 粉丝数 friends_count int 关注数 statuses_count int 微博数 favourites_count int 收藏数 created_at string 用户创建(注册)时间 following boolean 暂未支持 allow_all_act_msg boolean 是否允许所有人给我发私信,true:是,false:否 geo_enabled boolean 是否允许标识用户的地理位置,true:是,false:否 verified boolean 是否是微博认证用户,即加V用户,true:是,false:否 verified_type int 暂未支持 remark string 用户备注信息,只有在查询用户关系时才返回此字段 status object 用户的最近一条微博信息字段 详细 allow_all_comment boolean 是否允许所有人对我的微博进行评论,true:是,false:否 avatar_large string 用户头像地址(大图),180×180像素 avatar_hd string 用户头像地址(高清),高清头像原图 verified_reason string 认证原因 follow_me boolean 该用户是否关注当前登录用户,true:是,false:否 online_status int 用户的在线状态,0:不在线、1:在线 bi_followers_count int 用户的互粉数 lang string 用户当前的语言版本,zh-cn:简体中文,zh-tw:繁体中文,en:英语 文档更新时间: 2014-11-04 http://open.weibo.com/wiki/2/users/domain_show
http://hi.baidu.com/ietynxalzidjoye/item/77fa3d392e5f8b6f7c034bae