Fork me on GitHub
上一页 1 2 3 4 5 6 7 ··· 13 下一页
摘要: 利用ocr将pdf转为docx 项目地址:https://github.com/jiangnanboy/pdf_to_docx 背景 该项目首先将pdf文件转为图片形式,再使用百度的paddleocr对这些图片文件分别进行识别,利用PPStructure对识别的内容进行结构化,最终将结构化的内容保存 阅读全文
posted @ 2022-11-04 21:23 石头木 阅读(577) 评论(0) 推荐(0) 编辑
摘要: 中文句子标点符号预测 https://github.com/jiangnanboy/punctuation_prediction 对一个没有标点符号的句子预测标点,主要预测逗号、句号以及问号(,。?) 给句子添加标点符号 请下载模型 [pun_model.onnx],将模型放入model/ernie 阅读全文
posted @ 2022-10-20 19:25 石头木 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 项目地址:https://github.com/jiangnanboy/t5-onnx-corrector t5纠错模型及配置可自行下载 -> https://huggingface.co/shibing624/mengzi-t5-base-chinese-correction。 原始模型文件组成: 阅读全文
posted @ 2022-09-08 19:54 石头木 阅读(997) 评论(0) 推荐(0) 编辑
摘要: 项目地址见:https://github.com/jiangnanboy/spark_data_mining/tree/master/src/main/java/com/sy/dataalgorithms/advanced/time_series 一.概要 此项目将围绕一个时间序列预测任务展开。该任 阅读全文
posted @ 2022-08-22 21:07 石头木 阅读(1050) 评论(0) 推荐(0) 编辑
摘要: intelligent medical 尝试构建一个以疾病为中心的智慧医疗项目,整合搜索、推荐、图谱、问答以及语音等功能,形成一个较为完整的解决方案。 完整项目见:https://github.com/jiangnanboy/intelligent_medical 项目介绍 本项目中的医疗数据来自Q 阅读全文
posted @ 2022-08-01 18:29 石头木 阅读(815) 评论(0) 推荐(0) 编辑
摘要: 使用纠错模板对中文句子进行语法纠正 项目地址:https://github.com/jiangnanboy/gec_check_template introduction 模板见resources/zh_template/error_templates_500.txt A,B;1/2/3 requi 阅读全文
posted @ 2022-07-29 22:30 石头木 阅读(344) 评论(0) 推荐(0) 编辑
摘要: EventExtraction & TriplesExtraction 项目地址:https://github.com/jiangnanboy/triple_event_extract 一.中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件等事件抽取 examples/ExtractEve 阅读全文
posted @ 2022-07-19 22:06 石头木 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 利用java开发一个标量自动求导引擎,动态构建DAG图,并实现反向传播 。项目中把每个神经元切成一个个小的加法和乘法,然后以此构建一个完整的深度神经网络来进行二分类。 项目地址:https://github.com/jiangnanboy/micrograd4j 示例 以下是在标量数据上的一些示例: 阅读全文
posted @ 2022-05-31 20:01 石头木 阅读(643) 评论(0) 推荐(0) 编辑
摘要: 这里利用java加载macbert模型,并进行中文拼写纠错。 项目地址:https://github.com/jiangnanboy/macbert-java-onnx 步骤 1.利用java加载macbert模型,并进行纠错推理。 2.模型从这里 下载。 3.模型转换见这里 。 使用 1.sy/M 阅读全文
posted @ 2022-05-26 20:31 石头木 阅读(599) 评论(0) 推荐(0) 编辑
摘要: 项目地址:https://github.com/jiangnanboy/model2onnx 一.将roberta模型转为onnx,并对[MASK]进行推理预测。 二.将macbert模型转为onnx,并对中文进行拼写纠错。 一.roberta-onnx(对中文句子[MASK]预测) 将模型转为on 阅读全文
posted @ 2022-05-24 22:18 石头木 阅读(572) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 13 下一页