2016年11月23日
摘要: 中文文本中可能出现的标点符号来源比较复杂,通过匹配等手段对他们处理的时候需要格外小心,防止遗漏。以下为在下处理中文标点的时候采用的两种方法,如有更好的工具,请推荐补充。 1. 中文标点集合 比较常见标点有这些: 调用 "zhon包" 的 函数即可得到这些中文标点。 如果想用英文的标点,则可调用str 阅读全文
posted @ 2016-11-23 01:14 Arkenstone 阅读(62657) 评论(0) 推荐(5) 编辑