摘要: 最近,在数据挖掘课,要交课设了,打算做一个通过机器学习进行新闻分类,首先要有大量的文本(新闻),去做训练,并通过爬虫爬取大量的新闻 一,思路如下: 0.首先确定获取数据的网站 1.通过BeautifulSoup来切取链接 2. 然后使用python的第三方框架newspaper3k,直接通过给指定的 阅读全文
posted @ 2019-06-02 19:57 LiZR07 阅读(884) 评论(0) 推荐(0) 编辑