摘要: 用标题中的四种方式解析网页,比较其解析速度。当然比较结果数值与电脑配置,python版本都有关系,但总体差别不会很大。 下面是我的结果,lxml xpath最快,bs4最慢 以下是测试代码 测试代码二 测试结果 阅读全文
posted @ 2019-03-13 10:16 DreamBoy_张亚飞 阅读(3293) 评论(0) 推荐(0) 编辑
摘要: pkuseg简单易用,支持细分领域分词,有效提升了分词准确度。 目录 主要亮点 编译和安装 各类分词工具包的性能对比 使用方式 相关论文 作者 常见问题及解答 主要亮点 pkuseg具有如下几个特点: 编译和安装 目前仅支持python3 新版本发布:2019-1-23 修改了词典处理方法,扩充了词 阅读全文
posted @ 2019-03-13 09:22 DreamBoy_张亚飞 阅读(2445) 评论(0) 推荐(0) 编辑