会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
腾讯云加社区
博客园
首页
新随笔
联系
订阅
管理
2018年2月12日
如何使用 scikit-learn 为机器学习准备文本数据
摘要: 欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 文本数据需要特殊处理,然后才能开始将其用于预测建模。 我们需要解析文本,以删除被称为标记化的单词。然后,这些词还需要被编码为整型或浮点型,以用作机器学习算法的输入,这一过程称为特征提取(或矢量化)。 scikit-learn 库提供易于使用的工
阅读全文
posted @ 2018-02-12 16:43 腾讯云开发者
阅读(1445)
评论(1)
推荐(0)
编辑
公告