中文词向量论文综述
导读
前段时间看了一些有关中文词向量的论文,不过由于时间原因,最近几天才完成了整理,一共写了4篇综述,每篇包含2-3篇论文,链接里面是详细内容。
Paper
-
Component-Enhanced Chinese Character Embeddings
这是一篇2015年发表在EMNLP(Empirical Methods in Natural Language Processing)
会议上的论文,作者来自于香港理工大学 — 李嫣然。 -
Joint Learning of Character and Word Embeddings
这是一篇2015年发表在IJCAI (International Joint Conference on Artificial Intelligence)
会议上的论文,作者来自于清华大学 — 陈新雄,徐磊。 -
Improve Chinese Word Embeddings by Exploiting Internal Structure
这是一篇2016年发表在NAACL-HLT(Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies)
会议上的论文,作者来自于中国科学技术大学 — Jian Xu。 -
Multi-Granularity Chinese Word Embedding
这是一篇2016年发表在EMNLP(Empirical Methods in Natural Language Processing)
会议上的论文,作者来自于信息内容安全技术国家工程实验室 — 殷荣超。 -
Learning Chinese Word Representations From Glyphs Of Characters
这是一篇2017年发表在EMNLP(Empirical Methods in Natural Language Processing)
会议上的论文,作者来自于台湾大学 — Tzu-Ray Su 和 Hung-Yi Lee。 -
Joint Embeddings of Chinese Words, Characters, and Fine-grained Subcharacter Components
这是一篇2017年发表在EMNLP(Empirical Methods in Natural Language Processing)
会议上的论文,作者来自于香港科技大学 — Jinxing Yu。 -
Enriching Word Vectors with Subword Information
这是一篇2017年发表在ACL(Association for Computational Linguistics)
会议上的论文,作者来自于Facebook AI Research — Piotr Bojanowski ,Edouard Grave 。 -
cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information
这是一篇2018年发表在AAAI 2018(Association for the Advancement of Artificial Intelligence 2018)
会议上的论文,作者来自于蚂蚁金服人工智能部 — 曹绍升 。 -
Radical Enhanced Chinese Word Embedding
这是一篇2018年发表在CCL2018(The Seventeenth China National Conference on Computational Linguistics, CCL 2018)
会议上的论文,作者来自于电子科技大学 — Zheng Chen 和 Keqi Hu 。
References
[1] Component-Enhanced Chinese Character Embeddings
[2] Joint Learning of Character and Word Embeddings
[3] Improve Chinese Word Embeddings by Exploiting Internal Structure
[4] Multi-Granularity Chinese Word Embedding
[5] Learning Chinese Word Representations From Glyphs Of Characters
[6] Joint Embeddings of Chinese Words, Characters, and Fine-grained Subcharacter Components
[7] Enriching Word Vectors with Subword Information
[8] cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information
[9] Radical Enhanced Chinese Word Embedding
个人信息
[1] Blog : https://bamtercelboo.github.io/
[2] Github : https://github.com/bamtercelboo
[3 ]知乎 :https://www.zhihu.com/people/bamtercelboo/activities
[4] 博客园: http://www.cnblogs.com/bamtercelboo/