摘要: 1. 将新闻的正文内容保存到文本文件。 2. 将新闻数据结构化为字典的列表: 单条新闻的详情-->字典news 一个列表页所有单条新闻汇总-->列表newsls.append(news) 所有列表页的所有新闻汇总列表newstotal.extend(newsls) 3. 安装pandas,用pand 阅读全文
posted @ 2018-04-18 12:01 HISAM 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 1. 用正则表达式判定邮箱是否输入正确。 2. 用正则表达式识别出全部电话号码。 3. 用正则表达式进行英文分词。re.split('',news) 4. 使用正则表达式取得新闻编号 5. 生成点击次数的Request URL 6. 获取点击次数 7. 将456步骤定义成一个函数 def getCl 阅读全文
posted @ 2018-04-10 16:03 HISAM 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 获取全部的校园新闻:包括 阅读全文
posted @ 2018-04-03 17:43 HISAM 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(newsurl) #返回response对象 res.en 阅读全文
posted @ 2018-03-30 21:36 HISAM 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 1.英文词频统 下载一首英文的歌词或文章 将所有,.?!’:等分隔符全部替换为空格 将所有大写转换为小写 生成单词列表 生成词频统计 排序 排除语法型词汇,代词、冠词、连词 输出词频最大TOP20 将分析对象存为utf-8编码的文件,通过文件读取的方式获得词频分析内容。 2.中文词频统计 下载一长篇 阅读全文
posted @ 2018-03-28 21:37 HISAM 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 总结列表,元组,字典,集合的联系与区别 列表是可变的对象,可进行动态的增加、删除、更新,用[]表示。 元组和列表在结构上没有什么区别,唯一的差异在于元组是只读的,不能修改。元组用“()”表示。 字典是存储键值对数据的对象,字典的元素都是无序的,且键不能相同,可以通过键,找到值,字典最外面用大括号,每 阅读全文
posted @ 2018-03-22 20:29 HISAM 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 校园新闻 阅读全文
posted @ 2018-03-20 16:18 HISAM 阅读(537) 评论(0) 推荐(0) 编辑
摘要: 请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local cd usr cd local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 ls -ausr mkdir命令: 阅读全文
posted @ 2018-03-13 17:27 HISAM 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 1.大数据对思维方式的重要影响: 近年来,“大数据”一次从原本陌生的专业领域一跃进入公众的眼帘,并作为时髦的热词写入各级政府工作报告中。它所掀起的新的数据技术革命,正深刻地改变我们这个时代的生产、工作和生活样式,并推动着人类认识、理解世界的方式改变。我们应该积极适应大数据风暴带来的思维方式的转变及观 阅读全文
posted @ 2018-03-06 19:57 HISAM 阅读(409) 评论(0) 推荐(0) 编辑
摘要: <程序>→<外部声明>|<程序><外部声明> <外部声明>→<函数定义>|<声明> <函数定义>→<类型说明><声明符><符合语句> <类型说明>→<void>|<char>|<int>|<float> <声明符>→<指针直接声明符>|<直接声明符> <指针>→<'*'>|< '*' 指针> <直 阅读全文
posted @ 2016-11-03 10:30 HISAM 阅读(332) 评论(1) 推荐(0) 编辑