上一页 1 2 3 4 5 6 ··· 12 下一页
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, 阅读全文
posted @ 2020-02-14 23:59 小神龙1258 阅读(473) 评论(0) 推荐(0) 编辑
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, 阅读全文
posted @ 2020-02-12 01:02 小神龙1258 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, 阅读全文
posted @ 2020-02-10 23:00 小神龙1258 阅读(364) 评论(0) 推荐(0) 编辑
摘要: 直接上代码: import jieba import pandas as pd import re from collections import Counter if __name__=='__main__': filehandle = open("news.txt", "r",encoding= 阅读全文
posted @ 2020-02-10 01:17 小神龙1258 阅读(665) 评论(0) 推荐(0) 编辑
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, 阅读全文
posted @ 2020-02-08 23:39 小神龙1258 阅读(697) 评论(0) 推荐(0) 编辑
摘要: 项目结构: 源码略微修改再上传,下面看看需求。 需求: 需求一:分析每年的信件数量,通过Echarts折线图展示出来。需求二:分析信件是属于投诉和咨询的比例,通过Echarts饼图展示出来。需求三:分析各个政府部门对信件的回答数量,通过Echarts柱状图展示出来。 一:每年的信件数量 二:信件是属 阅读全文
posted @ 2020-02-08 01:09 小神龙1258 阅读(702) 评论(0) 推荐(0) 编辑
摘要: 在上个爬虫代码中没有对信件类型进行分类,而且爬取的数据会出现大片时间爬取不到和回复内容爬取不到, 对代码进行优化后, 得到如下数据: 只显示部分数据,可以看到爬取的完整度基本完好。 代码如下: #coding:utf-8 import requests from lxml import etree 阅读全文
posted @ 2020-02-06 00:48 小神龙1258 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 直接上代码⑧: #coding:utf-8 import requests from lxml import etree import time import pymysql import datetime import urllib import json from IPython.core.pa 阅读全文
posted @ 2020-02-05 00:50 小神龙1258 阅读(911) 评论(0) 推荐(0) 编辑
摘要: 3 阅读全文
posted @ 2020-02-02 21:06 小神龙1258 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 2 阅读全文
posted @ 2020-02-02 21:04 小神龙1258 阅读(144) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 12 下一页