网络爬虫基础练习
摘要:练习: 这是练习的HTML文件:net.html 取出h1标签的文本 取出a标签的链接取出所有li标签的所有内容取出第2个li标签的a标签的第3个div标签的属性 取出一条新闻的标题、链接、发布时间、来源 问题:每次requests获取新建的HTML文件时,都要重新用浏览器打开net.html来更新
阅读全文
中文词频统计
摘要:下载一长篇中文文章。从文件读取待分析文本。news = open('gzccnews.txt','r',encoding = 'utf-8')安装与使用jieba进行中文分词。pip install jiebaimport jiebalist(jieba.lcut(news))生成词频统计排序排除语
阅读全文
综合练习:英文词频统计
摘要:# -*- coding:UTF-8 -*-# -*- author:deng -*-news = '''The only problem unconsciously assumed by all Chinese philosophers to be ofany importance is:How
阅读全文
字符串、组合练习
摘要:1.字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news
阅读全文
national flag
摘要:# -*- coding:UTF-8 -*- # -*- author:deng -*- import turtle import math window = turtle.Screen() def draw_polygon(aTurtle, size=50, n=3): # 绘制正多边形 for i in xrange(n): aTurtle.forward(...
阅读全文
常用的Linux操作
摘要:熟悉常用的Linux操作 cd命令:切换目录 (1) 切换到目录 /usr/local cd/usr/local (2) 去到目前的上层目录 cd.. (3) 回到自己的主文件夹 cd ls命令:查看文件与目录 (4) 查看目录/usr下所有的文件 ls/usr mkdir命令:新建新目录 (5)
阅读全文
大数据概述
摘要:1.试述大数据对思维方式的重要影响。 随着自然科学的快速发展和高新技术的广泛应用,人们的生活方式和思维方式都受到比较大的冲击。大数据技术的普及,对人类生活中的各个领域都产生着极大的影响。思维方式是一定时代人们的理性认识方式,是按一定结构、方法和程序把思维诸要素结合起来的相对稳定的思维运行样式。人类历
阅读全文