摘要: 在使用pandas对一列日期进行分组排序时报错, 1. 根据错误提示 File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2430, in <lambda> kwargs. 阅读全文
posted @ 2018-12-05 11:24 桑胡 阅读(2515) 评论(0) 推荐(0) 编辑
摘要: 最近使用cython时,遇到一个问题,报错如下: cl.exe /c /nologo /Ox /W3 /GL /DNDEBUG /MD "-Id:\program files\python361\include" "-Id:\program files\python361\include" "-IC 阅读全文
posted @ 2018-12-02 12:56 桑胡 阅读(4155) 评论(0) 推荐(0) 编辑
摘要: 要使用hanlp加载自定义词典可以通过修改配置文件hanlp.properties来实现。要注意的点是: 1. root根路径的配置: hanlp.properties中配置如下: #本配置文件中的路径的根目录,根目录+其他路径=完整路径(支持相对路径,请参考:https://github.com/ 阅读全文
posted @ 2018-11-27 13:49 桑胡 阅读(5401) 评论(0) 推荐(0) 编辑
摘要: 最近在学习搭建hadoop集群环境,在搭建的过程中遇到很多问题,在这里做一些记录。1. SSH相关的问题 问题一: ssh: connect to host localhost port 22: Connection refused 问题二: 远程连接需要输入密码。 参照以下博客即可解决: Linu 阅读全文
posted @ 2018-11-25 16:59 桑胡 阅读(843) 评论(0) 推荐(0) 编辑
摘要: CountVectorizer: CountVectorizer可以将文本文档集合转换为token计数矩阵。(token可以理解成词) 此实现通过使用scipy.sparse.csr_matrix产生了计数的稀疏表示。 如果不提供一个先验字典,并且不使用进行某种特征选择的分析器,那么特征的数量将与通 阅读全文
posted @ 2018-11-13 17:12 桑胡 阅读(3622) 评论(0) 推荐(0) 编辑
摘要: 问题: 本地windows系统远程连接kafka报错,kafka.errors.NoBrokersAvailable: NoBrokersAvailable。 解决: 在网上看到说是hosts文件需要修改,找到windows系统中的hosts文件,位置在C:\Windows\System32\dri 阅读全文
posted @ 2018-11-04 23:19 桑胡 阅读(21881) 评论(0) 推荐(1) 编辑
摘要: 问题: windows平台下使用python open函数w模式打开文件报错“OSError: [Errno 22] Invalid argument: '../news/“消费升维”成零售业新风口?渠道多元同步跟进.txt'” 解决: 本来猜测是转义符的问题,但是使用python原字符串仍然不能解 阅读全文
posted @ 2018-11-04 23:17 桑胡 阅读(13075) 评论(0) 推荐(1) 编辑
摘要: 上面代码中,传入列表[all, "mark i"]和传入元组(all, "mark i")的结果不一致。 其中,df.loc中传入列表,相当于列表中的每一个元素都需要对df进行索引切片。第一个元素是all,这个all相当于匹配任何索引,所以所有的数据都打印出来了。传入元组,则相当与只使用元组执行一次 阅读全文
posted @ 2018-11-02 17:08 桑胡 阅读(2441) 评论(0) 推荐(0) 编辑
摘要: 错误信息如下: Using base prefix 'c:\\users\\huful\\appdata\\local\\programs\\python\\python36-32'New python executable in E:\Learning\Python\search\Scripts\ 阅读全文
posted @ 2018-10-21 12:22 桑胡 阅读(3735) 评论(1) 推荐(0) 编辑
摘要: 函数在项目启动后, end_date得到当前的时间为2018-10-19号,只要项目不刷新,时间会一直定格在2018-10-19这个值。但是函数本意是获取当天的时间,这样很可能会引起相应问题。 阅读全文
posted @ 2018-10-19 11:13 桑胡 阅读(2921) 评论(0) 推荐(0) 编辑