03 2018 档案

摘要:练习: 新建一个用于练习的html文件,在浏览器中打开。 利用requests.get(url)获取网页页面的html文件 利用BeautifulSoup的HTML解析器,生成结构树 取出h1标签的文本 取出a标签的链接 取出所有li标签的所有内容 取出一条新闻的标题、链接、发布时间、来源 标题: 阅读全文
posted @ 2018-03-29 11:21 KingdomJay 阅读(132) 评论(0) 推荐(0) 编辑
摘要:1.英文词频统计: 下载一首英文的歌词或文章 将所有,.?!’:等分隔符全部替换为空格 将所有大写转换为小写,生成单词列表 生成词频统计 排序 排除语法型词汇,代词、冠词、连词 输出词频最大TOP20 将分析对象存为utf-8编码的文件,通过文件读取的方式获得词频分析内容。 读取歌词: 保存分析结果 阅读全文
posted @ 2018-03-27 16:59 KingdomJay 阅读(196) 评论(0) 推荐(0) 编辑
摘要:1.组合数据类型练习:分别定义字符串,列表,元组,字典,集合,并进行遍历。总结列表,元组,字典,集合的联系与区别。 列表是用[]括起来,元组是用()括起来的,字典集合都是用{}括起来。列表是可变序列,可以索引查找元素进行增删,而元组是只读列表,数据不可修改。 字典由一对对键值对组成,键唯一值不唯一, 阅读全文
posted @ 2018-03-22 19:10 KingdomJay 阅读(128) 评论(0) 推荐(0) 编辑
摘要:取得校园新闻的编号 产生python文档的网址 产生校园新闻的一系列新闻页网址: 练习字符串内建函数:strip,lstrip,rstrip,split,count 用函数得到校园新闻编号 用函数统计一歌词(文章、小说)中单词出现的次数,替换标点符号为空格,用空格进行分词。 阅读全文
posted @ 2018-03-20 16:04 KingdomJay 阅读(208) 评论(0) 推荐(0) 编辑
摘要:cd命令:切换目录 (1)切换到目录 /usr/localcd /usr/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 cd /usr ls -al mkdir命令:新建新目录 (5)进入/tmp目 阅读全文
posted @ 2018-03-13 17:04 KingdomJay 阅读(6605) 评论(0) 推荐(1) 编辑
摘要:1.试述大数据对思维方式的重要影响。 大数据对思维方式带来的转变有三种:全样而非抽样、效率而非精确、相关而非因果。 ①、全样而非抽样:在过去,数据存储和处理能力有限,所以在科学分析中一般采用抽样的方法,而现 在,有了大数据技术的支持,科学分析可以直接针对全样数据进行分析而不是抽样数据; ②、效率而非 阅读全文
posted @ 2018-03-06 16:21 KingdomJay 阅读(496) 评论(0) 推荐(0) 编辑