文本挖掘之词云及个性化词云
摘要:文本挖掘之词云及个性化词云 一:词云-WordCloud 词云:对文本中出现的关键词按照出现频率通过改变字体字号颜色样式等方式集中显示 个人看法,wordcloud是一款将词语(支持英文、中文等各种语言词汇)作为基本元素,对图像文件进行十分高效填充的文字展示工具。同时,还可使用masks(掩膜)功能
阅读全文
posted @
2020-04-06 23:58
一只阿木木
阅读(1364)
推荐(1) 编辑
示例python 批量操作excel统计销售榜品牌及销售额
摘要:示例统计销售榜品牌及销售额 import pandas as pd import numpy as np import os os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx' df = pd.read_excel(name) df.hea
阅读全文
posted @
2020-03-04 16:34
一只阿木木
阅读(2888)
推荐(0) 编辑
目标用户偏好指数Target Group Index分析
摘要:目标用户偏好指数Target Group Index分析 TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。 TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100 TGI指数大于100,
阅读全文
posted @
2020-03-03 18:00
一只阿木木
阅读(3073)
推荐(0) 编辑
90万条数据玩转RFM用户分析模型
摘要:RFM,是一种经典的用户分类、价值分析模型: R,Rencency,即每个客户有多少天没回购了,可以理解为最近一次购买到现在隔了多少天。 F,Frequency,是每个客户购买了多少次。 M,Monetary,代表每个客户平均购买金额,也可以是累计购买金额。 这三个维度,是RFM模型的精髓所在,帮助
阅读全文
posted @
2020-02-15 14:21
一只阿木木
阅读(2312)
推荐(0) 编辑
爬虫系列4:Requests+Xpath 爬取动态数据
摘要:爬虫系列4:Requests+Xpath 爬取动态数据 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/102
阅读全文
posted @
2019-01-15 17:05
一只阿木木
阅读(3526)
推荐(0) 编辑
爬虫系列3:Requests+Xpath 爬取租房网站信息并保存本地
摘要:数据保存本地 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/10267721.html 【保存】:参考前文
阅读全文
posted @
2019-01-15 11:23
一只阿木木
阅读(1083)
推荐(0) 编辑
爬虫系列2:Requests+Xpath 爬取租房网站信息
摘要:Requests+Xpath 爬取租房网站信息 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/1026772
阅读全文
posted @
2019-01-14 16:47
一只阿木木
阅读(1370)
推荐(0) 编辑
爬虫系列1:Requests+Xpath 爬取豆瓣电影TOP
摘要:爬虫1:Requests+Xpath 爬取豆瓣电影TOP 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/10
阅读全文
posted @
2018-08-09 19:00
一只阿木木
阅读(1895)
推荐(1) 编辑