摘要: 作业要求: 1. 取出一个新闻列表页的全部新闻 包装成函数。 2. 获取总的新闻篇数,算出新闻总页数。 3. 获取全部新闻列表页的全部新闻详情。 4. 找一个自己感兴趣的主题,进行数据爬取,并进行分词分析。不能与其它同学雷同。 前三个要求代码如下: 结果截图: 第四个要求中,我爬取了校园所有的新闻描 阅读全文
posted @ 2018-04-11 14:00 Lger 阅读(286) 评论(0) 推荐(0) 编辑
摘要: Spring Boot对于该家族的框架支持良好,但是当中本人作为小白配置还是有一点点的小问题,这里分享一下。这个项目是使用之前发布的 "Spring Boot会员管理系统" 重新改装,将之前filter登录验证改为Spring Security 1. 配置依赖 Spring Boot框架整合Spri 阅读全文
posted @ 2018-04-07 14:47 Lger 阅读(1260) 评论(2) 推荐(0) 编辑
摘要: 以下是练习使用URL链接: http://news.gzcc.cn/html/xiaoyuanxinwen/ 这里是使用了requests库和BeautifulSoup库来做爬虫练习,所以在使用前先安装好这两个库 练习要求如下: 取出h1标签的文本 取出a标签的链接 取出所有li标签的所有内容 取出 阅读全文
posted @ 2018-03-28 20:27 Lger 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 以下是关于小说的中文词频统计 这里有三个文件,分别为novel.txt、punctuation.txt、meaningless.txt。 这三个是小说文本、特殊符号和无意义词 Python代码统计词频如下: 相关代码已上传 "CSDN" 阅读全文
posted @ 2018-03-28 19:46 Lger 阅读(1379) 评论(0) 推荐(0) 编辑
摘要: Apache Maven是一款软件项目管理及综合工具。基于项目对象模型这个概念,Maven能够从一个中心信息块管理项目的构建,报告和文档。 阅读全文
posted @ 2018-03-25 17:17 Lger 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 我在统计词频的过程中是使用了amazing grace的歌词,歌词大致如下: 我将上面的歌词放入一个 的文件中,现在就可以进行代码编写,代码如下: 以上的代码中给出了大量的注释,如果有出现纰漏,请多多交流,可以邮箱联系。 参考链接 排序:https://www.cnblogs.com/timtike 阅读全文
posted @ 2018-03-21 21:34 Lger 阅读(176) 评论(2) 推荐(0) 编辑
摘要: 1.字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news 阅读全文
posted @ 2018-03-21 20:53 Lger 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 温馨提示 Spring Boot会员管理系统的中,需要涉及到Spring框架,SpringMVC框架,Hibernate框架,thymeleaf模板引擎。所以,可以学习下这些知识。当然,直接入门的话使用是没问题,但是,涉及到一些异常和原理的话可能就有些困难。 1. 前端部分 在前端部分 是通过for 阅读全文
posted @ 2018-03-18 20:09 Lger 阅读(603) 评论(0) 推荐(1) 编辑
摘要: 代码如下: 画出的红旗截图如下: 阅读全文
posted @ 2018-03-15 12:43 Lger 阅读(780) 评论(0) 推荐(0) 编辑
摘要: cd命令:切换目录 (1) 切换到目录 /usr/local (2) 去到目前的上层目录 (3) 回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 mkdir命令:新建新目录 (5)进入/tmp目录,创建一个名为a的目录,并查看有多少目录存在 (6)创建目录a1/a2 阅读全文
posted @ 2018-03-14 21:36 Lger 阅读(1420) 评论(0) 推荐(0) 编辑