摘要: BERT模型的使用可以分为两种形式:第一种使用方法直接将语句序列输入BERT模型获取特征表示,BERT模型一共提供十二层不同的特征向量输出,随层数的递进,特征表示从专于词义表示到专于语义表示而有所区别,此时BERT模型相当于静态的word2vector模型,仅用于特征表示,关于如何获取BERT预训练模型及如何使用第一种方法,可以参考前一篇博客。 阅读全文
posted @ 2020-04-22 16:39 网管布吉岛 阅读(2232) 评论(0) 推荐(0) 编辑
摘要: 模型源码在github,该项目的Readme.md文件中提供了9个模型的下载链接。前两个是区分大小写的英文模型,第三个是中文模型,4589没有用过具体不太清楚,六七是不区分大小写的英文模型(根据Readme.md中的描述,如果对大小写不是很敏感的话用uncased已经完全足够了,但是我觉得像GEC这种任务应该对大小写还是相当敏感的)。文件夹名称中的"bert_"前缀是我自己添加以区分其他模型的。 阅读全文
posted @ 2020-04-22 16:36 网管布吉岛 阅读(2645) 评论(0) 推荐(0) 编辑