会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Comero 's Blog
博客园
首页
新随笔
联系
订阅
管理
04 2018 档案
Python3 中日语料分句实现
摘要:0. 背景 因为最近在看平行语料句对齐、词对齐的缘故,想做对齐的话需要先做一个分句。 一开始利用正则和引号开关标志写了一种方法,中间想到一个小技巧,写出来比较简单通用,想把这一小段代码分享一下。 1. 原理 一些情况下,标点也算是比较好的一个特征,这里就想尽量正确的切分。 主要考虑到的问题包括: +
阅读全文
posted @
2018-04-27 09:41
Comero
阅读(700)
评论(0)
推荐(0)
公告