随笔 - 383  文章 - 0  评论 - 0  阅读 - 35125 
02 2021 档案
使用有向无环图实现分词
摘要:结巴分词 如果搜索”Python 分词”,跳出来的前五个除了广告基本都包括“结巴分词”(Jieba)。可以说它是Python自然语言中使用最广泛的分词工具。它属于基于概率的模型,其原理主要是利用了显性的中文词库(包含常用词及词性和频率)。形如: 同时也支持隐... 阅读全文
posted @ 2021-02-28 20:43 xieyan0811 阅读(57) 评论(0) 推荐(0) 编辑
git下载太慢的改进方法
摘要:1. 配置git参数 $ git config --global http.postBuffer 524288000 # 加大缓存$ git config --global core.compression -1 # 设置默认压缩方法$ export GIT_... 阅读全文
posted @ 2021-02-17 12:07 xieyan0811 阅读(113) 评论(0) 推荐(0) 编辑
论文阅读:GBDT能否被深度学习取代——TabNet
摘要:论文名称:《TabNet: Attentive Interpretable Tabular Learning》 论文地址:https://arxiv.org/abs/1908.07442 相关代码:https://github.com/dreamquark-a... 阅读全文
posted @ 2021-02-17 11:37 xieyan0811 阅读(201) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示