摘要: Status: week 2 done. Week 1, 主要讲了大数据的的来源 - 机器产生的数据,人产生的数据(比如社交软件上的update, 一般是unstructed data), 组织产生的数据(一般是structured data) 怎么把unstructured data 转化成 st 阅读全文
posted @ 2018-08-13 16:27 mashuai_191 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 1. 分词 word segmentation 国内有jieba 分词 2. Named Entity Recognition 训练自己的Model How can I train my own NER model https://nlp.stanford.edu/software/crf-faq. 阅读全文
posted @ 2018-08-13 09:09 mashuai_191 阅读(262) 评论(0) 推荐(0) 编辑