会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
走python的路
博客园
首页
新随笔
联系
订阅
管理
2021年6月14日
从产品名称中 分离出产品类别 对长字符串的处理
摘要: 下面一组数据在工作中很常见,数据清洗的 功能之一 就是将 复杂的长字符串 进行分离,提取有效信息。 一、从title 中提取出 产品 主类别和次类别 处理思路: 1.将title列,通过分词工具(jieba)将长字符串进行分离。jieba是普遍分词,对于专业领域,我们还有别的特殊分词工具 2.jie
阅读全文
posted @ 2021-06-14 12:42 正在学Python
阅读(290)
评论(0)
推荐(0)
编辑
公告