随笔 - 383
文章 - 0
评论 - 0
阅读 -
35125
02 2021 档案
使用有向无环图实现分词
摘要:结巴分词 如果搜索”Python 分词”,跳出来的前五个除了广告基本都包括“结巴分词”(Jieba)。可以说它是Python自然语言中使用最广泛的分词工具。它属于基于概率的模型,其原理主要是利用了显性的中文词库(包含常用词及词性和频率)。形如: 同时也支持隐...
阅读全文
git下载太慢的改进方法
摘要:1. 配置git参数 $ git config --global http.postBuffer 524288000 # 加大缓存$ git config --global core.compression -1 # 设置默认压缩方法$ export GIT_...
阅读全文
论文阅读:GBDT能否被深度学习取代——TabNet
摘要:论文名称:《TabNet: Attentive Interpretable Tabular Learning》 论文地址:https://arxiv.org/abs/1908.07442 相关代码:https://github.com/dreamquark-a...
阅读全文