摘要:
一、虚拟DOM Virtual DOM(虚拟DOM)不是真实的DOM对象,它是由普通的JS对象来描述DOM对象。 真实DOM对象它的成员非常多,所以创建真实DOM的成本非常高。 创建一个虚拟DOM(普通的JavaScript对象)的属性非常少,所以创建一个虚拟DOM的成本比真实DOM要小很多 二、为 阅读全文
摘要:
var let const 可否同一作用域下声明同名变量 可以 不可以 不可以 声明的变量是否会挂载到window上 会 不会 不会 声明变量是否存在变量提升 存在 不存在(变量必须声明之后才能使用) 不存在(变量必须声明之后才能使用) 声明的变量是否会形成块作用域 不会 会 会 声明变量之后能否更 阅读全文
摘要:
一、IntelliJ IDEA 2018.2.4破解: 可参考:https://www.cnblogs.com/iathanasy/p/9469280.html 二、WebStorm 2018.2.4破解: 1.下载webstorm 2018.2.4 链接:https://pan.baidu.com 阅读全文
摘要:
一、将爬虫大作业产生的csv文件上传到HDFS (1)在/usr/local路径下创建bigdatacase目录,bigdatacase下创建dataset目录,再在 windows 通过共享文件夹将爬取的census_all_data.csv文件传进 Ubuntu ,使用cp命令讲census_a 阅读全文
摘要:
一、目录操作 1.开启Hadoop服务 2.在HDFS中为hadoop用户创建一个用户目录(hadoop用户) 3.在用户目录下创建一个input目录 4.在HDFS的根目录下创建一个名称为input的目录 5.删除HDFS根目录中的“input”目录 二、文件操作 1.使用vim编辑器,在本地Li 阅读全文
摘要:
一、安装Linux,MySql (一)安装前准备 1.安装Linux前需要安装 Oracle VM VirtualBox, 下载 https://www.virtualbox.org/wiki/Downloads 。 2.安装成功后,打开VirtualBox。 (二)安装Linux 1.新建虚拟机, 阅读全文
摘要:
一、把爬取的校园新闻内容保存到数据库 (一)保存到sqlite3 1 # 保存到sqlite3数据库 2 def save_in_sqlite(): 3 news_df = save_file() 4 with sqlite3.connect('gzccnewsdb.sqlite')as db: 5 阅读全文
摘要:
一、从新闻url获取点击次数,获取新闻发布时间及类型转换,并整理成函数 获取新闻URL点击次数 1 # 获取新闻点击次数 2 def get_click_num(arg_news_url): 3 click_id = re.findall("(\\d{1,5})", arg_news_url)[-1 阅读全文
摘要:
1. 简单说明爬虫原理 使用python的requests模块模拟浏览器向服务器发送http请求,服务器接收到请求后向爬虫返回html数据,爬虫将返回的html数据保存下来,并利用bs4进行分析,将需要的数据截取下来并保存。 2. 理解爬虫开发过程 1).简要说明浏览器工作原理 在浏览器的地址栏输入 阅读全文
摘要:
1. 下载一长篇中文小说 此处下载的长篇中文小说是:三体 2. 从文件读取待分析文本 1 text = open("C:三体.txt", "r", encoding="UTF-8").read() # 读取文本 3. 安装并使用jieba进行中文分词 通过命令行,使用命令:pip install j 阅读全文