随笔分类 -  Python

python文本分类
摘要:前面博客里面从谣言百科中爬取到了所有类别(10类)的新闻并以文本的形式存储。 现在对这些数据进行分类,上代码: 运行完分类完成! 阅读全文

posted @ 2018-03-09 16:16 baorant 阅读(2889) 评论(1) 推荐(0) 编辑

文本处理之Python词频统计
摘要:往前2篇的博客中,爬取了谣言百科网站中不同分类的新闻并以文本的形式存取下来啦。 上一篇博客中对存取的文件进行了中文分词操作,现在我们想要对存取的文本进行词频统计操作。 上代码: 运行完词频统计结束~ 阅读全文

posted @ 2018-03-08 15:05 baorant 阅读(640) 评论(0) 推荐(0) 编辑

文本分词处理Python实践
摘要:上一篇博客中爬取到了10个类别中数据并以文本的形式存取。 第二步便考虑对获得的文本进行分词操作~ 开发环境: anaconda3; jieba分词;(在anaconda中pip install jieba 命令成功下载并安装jieba包(conda和pip是两个不同的包管理器,那个jieba没在co 阅读全文

posted @ 2018-03-08 12:38 baorant 阅读(1779) 评论(0) 推荐(0) 编辑

爬虫实践2
摘要:在前一篇博客中,爬了谣言百科中baby类的百科,现在要同时爬所有类别的百科时应该怎么做呢? 无非是添加一个网址list,和一个类别名list,然后进行遍历爬取数据即可! 上代码: 当然,自己应提前建好类别的文件夹,如图: 然后运行即可得到数据! 阅读全文

posted @ 2018-03-07 17:23 baorant 阅读(246) 评论(0) 推荐(0) 编辑

爬虫实践1
摘要:1、开发环境: Anaconda3; python 3.6.4; 爬虫部分 使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站,其实这个实战是我谣言处理系统的一部分,但是现阶段对于谣言处理系统我遇到了问题就是精度提高。现 阅读全文

posted @ 2018-03-07 15:29 baorant 阅读(231) 评论(0) 推荐(0) 编辑

Python三个整数x,y,z,请把这三个数由小到大输出(冒泡排序)
摘要:Python版: 结果: 阅读全文

posted @ 2018-02-07 17:12 baorant 阅读(5427) 评论(0) 推荐(0) 编辑

Python一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少?
摘要:Python版: 结果: 阅读全文

posted @ 2018-02-07 16:16 baorant 阅读(1574) 评论(0) 推荐(0) 编辑

Python和java题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?
摘要:Python版: Java版: 阅读全文

posted @ 2018-02-07 15:07 baorant 阅读(988) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示