摘要:
Python3修行之路 第一关:Python3基础 查看 第二关:数据库及ORM Mysql Redis Mongodb ORM 第三关:web前端 HTML CSS JS BootStrap JQuery 第四关:web框架 Django Flask Tronado 第五关:Linux 第六关:网 阅读全文
摘要:
https://blog.csdn.net/qq_39259944/article/details/88869341 阅读全文
摘要:
https://www.cnblogs.com/flashsun/p/14266148.html 阅读全文
摘要:
pip使用国内源升级 python -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip 常用的国内源 https://pypi.tuna.tsinghua.edu.cn/simple/ # 清华大学 htt 阅读全文
摘要:
本文采用的数据集是阿里天池提供的user_behavior_data_on_taobao_app公开数据集进行分析,期望通过此次分析能通推动产品迭代、实现精准营销,提供定制服务,驱动产品决策等,需要此数据的小朋友们可以前往天池下载 用户行为分析 想要进行精细化运营,围绕的中心永远是用户。用户研究的常 阅读全文
摘要:
机器学习之集成学习方式 1、bagging-(RF) 随机森林 两种随机过程的区别(bagging和RF(随机森林)) 随机森林的优缺点: 随机的艺术 2、boosting-(GBDT/Adaboost/XGBOOST) 加权步骤 权重更新 统计机器学习例子 3、stacking 阅读全文
摘要:
Python进行携程酒店评论舆情分析 第一步:分析设计 我们是对酒店进行舆情分析,所有我们的核心是酒店的评论数据;对住客的评论数据进行特征提取,通过住客对酒店的评分,对数据进行分类,并使用朴素贝叶斯算法建立数学模型 第二步:数据收集 爬取酒店的相应类型的数据,如酒店的名称,住客的评论,酒店的回复,住 阅读全文
摘要:
本文介绍文本处理时比较常用且有效的tfidf特征提取方法 1. 提取tf特征 TF即是词频(Term Frequency)是文本信息量统计方法之一,简单来说就是统计此文本中每个词的出现频率 def computeTF(wordDict, bow): tfDict = {} bowCount = le 阅读全文
摘要:
网址:http://www.yy6080.cn/ 目标分析 m3u8 服务器将一个完整的视频切割成1000份;把每一小份视频存储到一个m3u8文件中; 还有一个m3u8文件存储着这个视频是否加密,以及该视频小m3u8目录存放的具体位置 而浏览器拿到的是一个大的m3u8文件 爬取思路 先请求到主页面 阅读全文
摘要:
地址是:https://postwoman.io/ ,不过只能使用它们自己提供的测试接口,如果你调试自己的API接口的话,你需要自己部署一套代码。 自己搭建一套Postwomen环境的话,只需要安装了node环境即可,既可以本地部署,也可以跑在docker环境,非常方便。感兴趣的可以自己动手折腾一下 阅读全文