2016年11月8日

摘要: 想要做个新闻文本识别分类的项目,就先写了个爬取百度新闻的爬虫。 环境:win7 32 bit python3.4 若干第三方库 可以实现的功能:定期按照百度新闻的分类抓取新闻的标题,所属类别及文本内容,并自动存入数据库(MySQL),同时发邮件到自己邮箱提醒。 缺陷:因新闻来源不同,网页编码不同,会 阅读全文

posted @ 2016-11-08 12:55 不秩稚童 阅读(1694) 评论(0) 推荐(0) 编辑