上一页 1 2 3 4 5 6 ··· 39 下一页
  2021年12月4日
摘要: 使用DrawView三方插件可生成动态索引 列出当前笔记中的所有标签 `= this.file.tags` 根据文件生成索引列表 将”目录名“文件夹(含子文件夹)下所有名字包含‘2021’的文件生成索引列表,并按时间排序。 \```dataviewlist f... 阅读全文
posted @ 2021-12-04 17:01 xieyan0811 阅读(881) 评论(0) 推荐(0) 编辑
摘要: 我的困惑 这几年写了不少笔记文章,分布在微博、CSDN、知乎、公众号、有道云笔记、飞书…… 随着平台的更替改版,越发改不动了,具体的问题罗列如下: 不同平台文章格式不同切换平台过程中文章和图片丢失忘了写在哪里找不到了重要的文章发多个平台,虽然格式可以复制粘贴,... 阅读全文
posted @ 2021-12-04 16:58 xieyan0811 阅读(342) 评论(0) 推荐(0) 编辑
  2021年11月27日
摘要: 模式介绍 基本用法 ^: 匹配字符串的开头,如:^很$: 匹配字符串的末尾,如:蓝$.: 匹配除了换行符外的任意字符,指定re.S(re.DOTALL)时,可包括换行符[]: 匹配[]中任意一个字符,如:\[Pp\],\[0-9\][^...]: 匹配不在[]... 阅读全文
posted @ 2021-11-27 16:07 xieyan0811 阅读(52) 评论(0) 推荐(0) 编辑
  2021年10月13日
摘要: 最近需要把扫描的PDF转换成文本,试用了pdfminer,pypdf2等工具,解析图片的效果都不太好,用起来也比较麻烦,后来试用了PyMuPDF,相对其它工具,它最新版本屏蔽了更多细节,围绕Page进行操作,调用非常方便。除了PDF它还支持解析epub等电子书... 阅读全文
posted @ 2021-10-13 14:58 xieyan0811 阅读(230) 评论(0) 推荐(0) 编辑
  2021年10月5日
摘要: 论文地址:https://arxiv.org/abs/1908.10084 论文中文翻译:https://www.cnblogs.com/gczr/p/12874409.html 源码下载:https://github.com/UKPLab/sentence-... 阅读全文
posted @ 2021-10-05 20:41 xieyan0811 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 自然语言处理库Transformers包含了BERT、GPT、GPT-2、Transformer-XL、XLNet、XLM等模型的实现,近两年Pytorch生态日趋成熟。因此,本文中使用Transformers的Pytorch支持来调用BERT模型。 检查cu... 阅读全文
posted @ 2021-10-05 20:39 xieyan0811 阅读(248) 评论(0) 推荐(0) 编辑
  2021年9月20日
摘要: 环境配置: 以下实验使用当前最新版本shap:0.39.0 $ pip install shap 注意xgboost也需要使用对应的较新版本,如: $ pip install xgboost==0.82 为使用交互界面,notebook环境下,加载用于可视化的... 阅读全文
posted @ 2021-09-20 17:13 xieyan0811 阅读(801) 评论(0) 推荐(0) 编辑
  2021年5月30日
摘要: 论文地址:https://arxiv.org/pdf/1606.07792.pdf 相关代码:https://github.com/jrzaurin/pytorch-widedeep 《Wide & Deep Learning for Recommender ... 阅读全文
posted @ 2021-05-30 15:47 xieyan0811 阅读(58) 评论(0) 推荐(0) 编辑
  2021年4月11日
摘要: 论文地址:https://arxiv.org/pdf/1702.08835.pdf 相关代码:https://github.com/kingfengji/gcForest 深度森林是南大周志华老师前两年提出的一种基于随机森林的深度学习模型。 当前的深度学习模型... 阅读全文
posted @ 2021-04-11 11:01 xieyan0811 阅读(154) 评论(0) 推荐(0) 编辑
  2021年2月28日
摘要: 结巴分词 如果搜索”Python 分词”,跳出来的前五个除了广告基本都包括“结巴分词”(Jieba)。可以说它是Python自然语言中使用最广泛的分词工具。它属于基于概率的模型,其原理主要是利用了显性的中文词库(包含常用词及词性和频率)。形如: 同时也支持隐... 阅读全文
posted @ 2021-02-28 20:43 xieyan0811 阅读(50) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 39 下一页