摘要: 1. 分析 构建词云需要具备: 原料即文章等内容 将内容进行分词 将分词后的内容利用构建词云的工具进行构建 保存成图片 2. 需要的主要模块 jieba 中文分词 wordcloud 构建词云 3. 模块原理 wordcloud的实现原理 文本预处理 词频统计 将高频词以图片形式进行彩色渲染 jie 阅读全文
posted @ 2018-08-05 23:31 littlebob 阅读(3127) 评论(0) 推荐(0) 编辑
摘要: 转载 Python3之关闭SSL证书验证 转载 Python requests 移除SSL认证,控制台输出InsecureRequestWarning取消方法 报错信息: 解决方法 今天遇到在requests设置移除SSL认证的时候,控制台会抛出以下警告: 解决方法 阅读全文
posted @ 2018-07-04 13:18 littlebob 阅读(11718) 评论(1) 推荐(0) 编辑
摘要: 需要下载代码的可以到我的GitHub上下载 https://github.com/FightingBob/-Web-Crawler-training 如果觉得可以,请给我颗star鼓励一下,谢谢! 阅读全文
posted @ 2018-06-24 10:51 littlebob 阅读(9932) 评论(0) 推荐(0) 编辑
摘要: 【转载】Python爬虫之UserAgent 用到的库 https://github.com/hellysmile/fake-useragent 阅读全文
posted @ 2018-06-24 09:09 littlebob 阅读(2309) 评论(0) 推荐(0) 编辑
摘要: 【转载】 【转载】安装mongodb以及设置为windows服务 详细步骤 将mongodb设置成windows服务,这样就不用使用命令启动了,设置方法如下: 1、在data文件夹下新建一个log文件夹,用于存放日志文件,在log文件夹下新建文件mongodb.log 2、在 D:\mongodb文 阅读全文
posted @ 2018-06-20 15:22 littlebob 阅读(5065) 评论(0) 推荐(1) 编辑
摘要: 项目代码 项目特点: 【转载】同步加载、异步加载、延迟加载 爬取的网站链接 KnewOne 需要下载代码的可以到我的GitHub上下载 https://github.com/FightingBob/-Web-Crawler-training 如果觉得可以,请给我颗star鼓励一下,谢谢! 阅读全文
posted @ 2018-06-19 16:54 littlebob 阅读(5746) 评论(0) 推荐(0) 编辑
摘要: 爬取的网站链接 穷游网 遇到的问题及解决办法 1.【转载】Python: 去掉字符串开头、结尾或者中间不想要的字符 ①Strip()方法用于删除开始或结尾的字符。lstrip()|rstirp()分别从左右执行删除操作。默认情况下会删除空白或者换行符,也可以指定其他字符。 ②如果想处理中间的空格,需 阅读全文
posted @ 2018-06-19 15:18 littlebob 阅读(4596) 评论(0) 推荐(0) 编辑
摘要: 利用Python做一个词频统计 GitHub地址:FightingBob 【Give me a star , thanks.】 词频统计 词频统计 对纯英语的文本文件【Eg: 瓦尔登湖(英文版).txt】的英文单词出现的次数进行统计,并记录起来 代码实现 1 import string 2 from 阅读全文
posted @ 2018-06-16 08:38 littlebob 阅读(4051) 评论(0) 推荐(0) 编辑
摘要: 整代码: 将以下代码保存为py文件 把要转成字符画的图片置于该文件的同级目录下 然后cmd打开命令行窗口 阅读全文
posted @ 2018-06-09 16:55 littlebob 阅读(4441) 评论(0) 推荐(0) 编辑
摘要: ^ 在字符的开启处进行匹配 $ 在字符的末尾处进行匹配 . 匹配任何字符(包括回车和新行) [….] 匹配括号内的任意单个字符 [m-n] 匹配m到n之间的任意单个字符,例如[0-9],[a-z],[A-Z] [^a-dX] 匹配任何不是a,b,c,d或者X的字符,前面的字符’^'是否定的意思 [^ 阅读全文
posted @ 2020-08-18 09:21 littlebob 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 题目: 从题目可知:求活跃用户 ———— 至少连续登录5天的人 ———— 连续区间且长度大于等于5使用方法:自定义变量求次数,初始次数为0,当符合条件时,次数加1逻辑条件:id相同,前后一行时间间隔为1天【date_sub()函数】 根据以上可以得出 select id, @cnt:=if(@id= 阅读全文
posted @ 2020-08-17 11:24 littlebob 阅读(665) 评论(0) 推荐(0) 编辑
摘要: 这道题的难点在于求差值,因为这道题比较特殊 假设只有这两种水果 那 select sale_date, sum(if(fruit='apples', 1, -1)*sold_num) as diff from `Sales` group by sale_date order by sale_date 阅读全文
posted @ 2020-08-14 09:12 littlebob 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 什么是前后端分离 定义 前后端分离是一种开发模式 核心思想 前端页面通过AJAX调用后端的Restful API接口并使用json数据进行交互 什么是前端 在客户端执行的脚本称为前端 什么是后端 在服务器端运行的脚本称为后端 什么是前后端不分离 客户端发送请求,服务端响应一个完整的网页 为什么要前后 阅读全文
posted @ 2020-08-13 11:22 littlebob 阅读(776) 评论(0) 推荐(0) 编辑
摘要: 题目: 解题思路: 别人写的很好,所以不用自己重写一遍了 阅读全文
posted @ 2020-08-10 09:58 littlebob 阅读(165) 评论(0) 推荐(0) 编辑
摘要: a表,时间字段为create_time 查询过去一年的数据 select * from a where create_time between date_add(date(curdate()), interval -1 year) and date(curdate()); 过去一个月 select 阅读全文
posted @ 2020-08-08 09:58 littlebob 阅读(688) 评论(0) 推荐(0) 编辑
摘要: 题目 解题思路 先看题目,再看结果从结果可以看出结果的前三列列为表students和subjects的交叉连接,也就是笛卡尔积而最后一列为每个学生参加每个学科的测试次数,也就是分组统计解题步骤1.求笛卡尔积 select * from `Students` as s1 cross join `Sub 阅读全文
posted @ 2020-08-07 10:56 littlebob 阅读(351) 评论(0) 推荐(0) 编辑
摘要: 看完题目后,我一般先看结果的样子从结果可以看出,是按照成绩自定义分组自定义分组用到 group by case when所以先得出 select case when duration/60<5 then '[0-5>' when duration/60<10 then '[5-10>' when d 阅读全文
posted @ 2020-08-07 09:41 littlebob 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 题目 解题思路: 已存在的等式: leftSum + nums[i] + rightSum = sum 存在中心索引即: leftSum = rightSum 得出: 2leftSum = sum - nums[i] 查询过程: 循环查询,先将左边元素相加,再进行【2leftSum = sum - 阅读全文
posted @ 2020-08-06 17:53 littlebob 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 简单函数CASE [col_name] WHEN [value1] THEN [result1]…ELSE [default] END new_col_name -- 枚举 select t_name, case t_name when '张三' then '严肃' when '李四' then ' 阅读全文
posted @ 2020-08-04 09:03 littlebob 阅读(448) 评论(0) 推荐(0) 编辑