摘要: 数据分析在现在大数据时代里,已经成为了不可或缺的一部分。以下介绍对《世界计算机科学技术专业排名前五的大学在顶尖期刊论文数》的简单的数据分析 (数据来源:最好大学网) 要先获得数据有两种方式:1.是直接从网站上下载下来,保存为一种文件,对文件进行读取分析,2.是使用爬虫在网络上爬取数据。在这里我使用的 阅读全文
posted @ 2020-05-07 00:03 TsukiMoon 阅读(272) 评论(1) 推荐(3) 编辑
摘要: 爬虫这一节内容说难也难,说简单也简单,这就要看每个人要求了!我写了两个爬虫程序,算是分享一下我的心路历程吧!毕竟我是要搞AI和CTF的呢! 首先是在学习爬虫几天后的粗糙产品,简单的爬取了一下QQ音乐的榜单(感觉不正规) 同样,主要技术路径是requests-bs4的方法来执行的,通过import r 阅读全文
posted @ 2020-04-22 12:28 TsukiMoon 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 上次在上直播课的时候,教员提到了html这种标记语言。自己就在W3school上面学了一点点关于html的一些皮毛,自己动手写了一个小网页,同时自己对CTF这一块比较感兴趣,但是自己还是一个干干净净的小白,就在B站上找了一些关于Web安全的入门视频看了看,学了一点点html的漏洞东西(皮毛而已),学 阅读全文
posted @ 2020-04-11 22:53 TsukiMoon 阅读(558) 评论(1) 推荐(1) 编辑
摘要: 文章来源:人工智能百度百科 首先进行常规操作:使用jieba库将文本分词,再使用wordcloud库的相关方法制作成相关词云,code如下: 结果确是。。。。。。。这个词云中有着很多无比正确的废话(词)。古话说得好:宁缺毋滥!!! 所以查询相关的词云库资料,了解了stopwords的用法,可以有效过 阅读全文
posted @ 2020-04-07 11:20 TsukiMoon 阅读(1087) 评论(1) 推荐(1) 编辑
摘要: Python语言的强大之处在于它的开源。正是因为它的开源,产生了成百上千的第三方库,涵盖了计算机的几乎所有的方向。第三方库的安装也并不是特别的复杂,通过在cmd中使用pip命令可以安装几乎所有的库,但是因为Python的服务器是在国外的,下载速度比较慢(尤其是下载numpy等大库的时候),为此我们使 阅读全文
posted @ 2020-04-02 18:25 TsukiMoon 阅读(224) 评论(1) 推荐(2) 编辑