摘要: 本章解决的问题: 1. 编写程序访问本地和网络上的文件(后的语言材料) 2.把文档分割成单独的词和标点符号(加工原料文本) 3.编写程序产生格式化的输出,把结果保存在一个文件中 NLP的流程 图处理流程: 打开一个URL,读里面HTML格式的内容,去除标记,并选择字符的切片,然后分词,是否转换为nl 阅读全文
posted @ 2021-01-22 14:20 吹梦西洲 阅读(178) 评论(0) 推荐(0) 编辑