摘要:
1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 我选择主题是游戏资讯,爬取的网站是:http://www.gamersky.com/news/ 爬取此网 阅读全文
摘要:
获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数 获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数 获取所有新闻列表页的网址,调用上述函数 完成所有校园新闻的爬取工作 阅读全文
摘要:
import requests from bs4 import BeautifulSoup from datetime import datetime import re def getclick(newsurl): num = re.search('_(.*).html',newsurl) id = num.group(1)[5:] clickurl = 'http:... 阅读全文
摘要:
用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
摘要:
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 讲下有关于运维方面的内容。 2.中文分词(**两项选做,此次作业要求不能雷同。) 下载一中文长篇小说,并转换成UTF-8编码。使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 **排除 阅读全文
摘要:
输出12个星座符号,以反斜线分隔。 恺撒密码的编码 输入姓名,格式输出:占4位、居中、不足4字的以空格填充。 格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 实例:打出99乘法表 实例: 下载一首英文的歌词或文章,统计单词出现的次数 阅读全文
摘要:
用循环画五角星 用循环画同心圆 用while循环画太阳花 用函数定义画五个五角星 用函数定义画钻石花瓣的太阳花 阅读全文
摘要:
Hello World! 简单交互(交互式,文件式)教材P19 用户输入两个数字,计算并输出两个数字之和: 用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 输入半径,计算圆的面积。 画一组同切圆 画一个五角星 画一个全黄色的五角星 阅读全文
摘要:
大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业 阅读全文