摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 不同的关键词算法 需求:通过项目概况,提取项目的核心关键词。解决办法:寻找不同关键词提取的算法,对比每种算法提取的结果。注:本文不对算法的推导进行描述,只写实现的路径。 模块导入数据导入1.tfidf2.加停词表的tfidf3. 阅读全文
posted @ 2019-03-29 13:47 ly803744 阅读(712) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 tableau过期 tableau作为一款数据可视化的软件,帮助任何人快速分析、可视化并分享信息。超过 42,000 家客户通过使用 Tableau 在办公室或随时随地快速获得结果。数以万计的用户使用 Tableau Publi 阅读全文
posted @ 2019-03-20 13:50 ly803744 阅读(4554) 评论(3) 推荐(1) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第三章 加工原料文本 3.8 分割断句分词 3.8 分割 断句 在词级水平处理文本通常假定能够将文本划分成单个句子,一些语料库已经提供在句子级别的访问,计算布朗语料库中每个句子的平均词数: import nltklen 阅读全文
posted @ 2019-03-14 16:14 ly803744 阅读(874) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 将mysql数据转换为excel格式并发送邮件 1.将mysql数据转换为excel import xlwtimport pymysql as MYSQLdbimport dat 阅读全文
posted @ 2019-03-11 15:54 ly803744 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 1.找到电脑右下角的WiFi图标,保证目前电脑是有网的; 2.点击——网络和Internet设置 3.点击 VPN 添加VPN连接 4.配置相关信息 完成后点击保存 5.点击以太网——点击 更改适配器选项 6.点击 l2tp ——右键 属性 7.点击选项——ppp设置——三个全部为打钩——确定——确 阅读全文
posted @ 2019-03-04 17:35 ly803744 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 在这个速查手册中,我们使用如下缩写:df:任意的Pandas DataFrame对象s:任意的Pandas Series对象 模块的导入: import pandas as pdimport&nbs 阅读全文
posted @ 2019-03-03 23:05 ly803744 阅读(3976) 评论(0) 推荐(1) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 Mac下mysql报错:ERROR 1045 (28000) 今天在安装MySQL之后,一直报错:ERROR 1045 (28000): Access denied for user 'root'@'localhost',通过寻 阅读全文
posted @ 2019-03-01 17:29 ly803744 阅读(1542) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 点击如下链接查看: python数据分析——(用户匿名数据、电影、婴儿姓名) 阅读全文
posted @ 2019-02-24 16:17 ly803744 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 当提起数据处理,一般情况下我们都可以用python中的pandas完成,但是当我们发现一些不规则的excel数据,所谓不规则如单元格存在合并等情况,像公司的财务报表数据等,我们可以利用python中的xlrd和xlwt模块对该类 阅读全文
posted @ 2019-02-24 16:11 ly803744 阅读(1842) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第三章 加工原料文本 3.7 用正则表达式为文本分词正则表达式的基础语法分词的简单方法 3.7 用正则表达式为文本分词 正则表达式的基础语法 正则表达式作为处理字符串的强大工具,拥有独特的语法和独特的处理引擎。 分词的简单方法 阅读全文
posted @ 2019-02-24 15:36 ly803744 阅读(1313) 评论(0) 推荐(0) 编辑