Trojans

2020年7月10日

摘要：一、虚拟DOM Virtual DOM（虚拟DOM）不是真实的DOM对象，它是由普通的JS对象来描述DOM对象。真实DOM对象它的成员非常多，所以创建真实DOM的成本非常高。创建一个虚拟DOM（普通的JavaScript对象）的属性非常少，所以创建一个虚拟DOM的成本比真实DOM要小很多二、为阅读全文

posted @ 2020-07-10 14:18 Trojans 阅读(318) 评论(2) 推荐(0)

2019年11月22日

var let const区别

摘要： var let const 可否同一作用域下声明同名变量可以不可以不可以声明的变量是否会挂载到window上会不会不会声明变量是否存在变量提升存在不存在（变量必须声明之后才能使用）不存在（变量必须声明之后才能使用）声明的变量是否会形成块作用域不会会会声明变量之后能否更阅读全文

posted @ 2019-11-22 11:46 Trojans 阅读(107) 评论(0) 推荐(0)

2019年6月20日

大数据应用（hadoop）

摘要：一、将爬虫大作业产生的csv文件上传到HDFS （1）在/usr/local路径下创建bigdatacase目录，bigdatacase下创建dataset目录，再在 windows 通过共享文件夹将爬取的census_all_data.csv文件传进 Ubuntu ，使用cp命令讲census_a 阅读全文

posted @ 2019-06-20 20:53 Trojans 阅读(819) 评论(0) 推荐(0)

2019年6月4日

分布式文件系统HDFS练习

摘要：一、目录操作 1.开启Hadoop服务 2.在HDFS中为hadoop用户创建一个用户目录（hadoop用户） 3.在用户目录下创建一个input目录 4.在HDFS的根目录下创建一个名称为input的目录 5.删除HDFS根目录中的“input”目录二、文件操作 1.使用vim编辑器，在本地Li 阅读全文

posted @ 2019-06-04 00:12 Trojans 阅读(311) 评论(0) 推荐(0)

2019年5月15日

安装Hadoop

摘要：一、安装Linux，MySql （一）安装前准备 1.安装Linux前需要安装 Oracle VM VirtualBox，下载 https://www.virtualbox.org/wiki/Downloads 。 2.安装成功后，打开VirtualBox。（二）安装Linux 1.新建虚拟机，阅读全文

posted @ 2019-05-15 16:06 Trojans 阅读(433) 评论(0) 推荐(0)

2019年5月9日

爬虫综合大作业

摘要：一、把爬取的校园新闻内容保存到数据库（一）保存到sqlite3 1 # 保存到sqlite3数据库 2 def save_in_sqlite(): 3 news_df = save_file() 4 with sqlite3.connect('gzccnewsdb.sqlite')as db: 5 阅读全文

posted @ 2019-05-09 21:53 Trojans 阅读(760) 评论(0) 推荐(0)

2019年4月15日

爬取全部的校园新闻

摘要：一、从新闻url获取点击次数，获取新闻发布时间及类型转换，并整理成函数获取新闻URL点击次数 1 # 获取新闻点击次数 2 def get_click_num(arg_news_url): 3 click_id = re.findall("(\\d{1,5})", arg_news_url)[-1 阅读全文

posted @ 2019-04-15 02:04 Trojans 阅读(237) 评论(0) 推荐(0)

2019年3月31日

理解爬虫原理

摘要： 1. 简单说明爬虫原理使用python的requests模块模拟浏览器向服务器发送http请求，服务器接收到请求后向爬虫返回html数据，爬虫将返回的html数据保存下来，并利用bs4进行分析，将需要的数据截取下来并保存。 2. 理解爬虫开发过程 1).简要说明浏览器工作原理在浏览器的地址栏输入阅读全文

posted @ 2019-03-31 22:01 Trojans 阅读(171) 评论(0) 推荐(0)

2019年3月25日

中文词频统计与词云生成

摘要： 1. 下载一长篇中文小说此处下载的长篇中文小说是：三体 2. 从文件读取待分析文本 1 text = open("C:三体.txt", "r", encoding="UTF-8").read() # 读取文本 3. 安装并使用jieba进行中文分词通过命令行，使用命令：pip install j 阅读全文

posted @ 2019-03-25 03:07 Trojans 阅读(1095) 评论(0) 推荐(0)

2019年3月23日

复合数据类型，英文词频统计

摘要：一、列表，元组，字典，集合的增、删、改、查以及遍历。 1.列表 1 pi = ['3', '.', '1', '4', '1', '5', '9', '2', '6', '5', '3', '5'] # 初始化 pi 列表 2 add = ['7', '9'] # 初始化 add 列表 3 4 # 阅读全文

posted @ 2019-03-23 01:06 Trojans 阅读(197) 评论(0) 推荐(0)

公告