FaceBook开源的词向量计算框架

　　fasttext是个好东西，是由facebook在2016年推出的一个训练词向量的模型。相比于之前Google的word2vec，fasttext可以解决out of vocabulary的问题。fasttext还能够用于有监督的文本分类。更赞的是，facebook提供了200多种语言的预训练模型和词向量。
　　具体操作可以使用pyfasttext模块实现。

　　代码如下：

1 from pyfasttext import FastText
2 # 加载出现的模型
3 model = FastText('./ch_data.bin')
4 #词表示学习
5 model.skipgram(input='data.txt', output='model', epoch=100, lr=0.7)
6 # model.cbow(input='data.txt', output='model', epoch=100, lr=0.7)
7 # 词向量
8 model['dog']

输出：

array('f', [-1.308749794960022, -1.8326224088668823, ...])

之后根据你的需要，将词向量用在什么地方由自己决定。

注意：pyfasttext,运行在linux和mac系统上
　　　fasttext,运行在windows上

posted @ 2018-10-31 14:10 今夜无风阅读(482) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

公告

昵称：今夜无风
园龄： 11年7个月
粉丝： 47
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

FaceBook开源的词向量计算框架

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论