静悟生慧

2018年9月27日

摘要： u/U:表示unicode字符串不是仅仅是针对中文, 可以针对任何的字符串，代表是对字符串进行unicode编码。一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u；但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。建议所有编码方式采用utf8 r/R:非转义的原阅读全文

posted @ 2018-09-27 13:46 静悟生慧阅读(1054) 评论(0) 推荐(0) 编辑

2018年9月25日

文本检测： CTPN

摘要：参考： https://zhuanlan.zhihu.com/p/37363942 https://zhuanlan.zhihu.com/p/34757009 https://zhuanlan.zhihu.com/p/31426458 【 Faster RCNN 非常详尽】对于理解RNN／LSTM 阅读全文

posted @ 2018-09-25 16:14 静悟生慧阅读(2105) 评论(0) 推荐(0) 编辑

ocr 识别 github 源码

摘要：参考 [1] https://github.com/eragonruan/text-detection-ctpn [2] https://github.com/senlinuc/caffe_ocr [3] https://github.com/YCG09/chinese_ocr 感谢作者！ [4] 阅读全文

posted @ 2018-09-25 10:29 静悟生慧阅读(6452) 评论(0) 推荐(0) 编辑

2018年9月24日

python 中写hive 脚本

摘要： 1、直接执行.sql脚本 2、Hive语句执行假如有如下hive sql：hive_cmd = 'hive -e "select count(*) from hbase.routermac_sort_10;"'一般在python中按照如下方式执行该hive sql：os.system(hive_c 阅读全文

posted @ 2018-09-24 18:14 静悟生慧阅读(5250) 评论(0) 推荐(0) 编辑

Win10 环境安装tesseract-ocr 4.00并配置环境变量

摘要： Tesseract-OCR的Training简明教程 https://blog.csdn.net/blueheart20/article/details/53207176 一、安装：选择对应版本，https://digi.bib.uni-mannheim.de/tesseract/ 1：下载安装包阅读全文

posted @ 2018-09-24 17:32 静悟生慧阅读(4074) 评论(0) 推荐(0) 编辑

OCR 识别原理

摘要： https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=402907292&idx=1&sn=889c4abcf576e24525ea6a705069c4de https://blog.csdn.net/zgwangbo/article/detai 阅读全文

posted @ 2018-09-24 12:13 静悟生慧阅读(581) 评论(0) 推荐(0) 编辑

pandas set_index和reset_index的用法

摘要： 1.set_index DataFrame可以通过set_index方法，可以设置单索引和复合索引。 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) append添加新阅读全文

posted @ 2018-09-24 10:51 静悟生慧阅读(15840) 评论(0) 推荐(1) 编辑

整理 pandas 常用函数

摘要： 1. df.head（n）: 显示数据前n行，不指定n，df.head则会显示所有的行 2. df.columns.values获取所有列索引的名称 3. df.column_name: 直接获取列column_name的数据 4. pd.unique(Series)获取Series中元素的唯一值（阅读全文

posted @ 2018-09-24 10:07 静悟生慧阅读(3145) 评论(0) 推荐(0) 编辑

pandas contact 之后，若要用到index列，要记得用reset_index去处理index

摘要：说明：直接contact之后，index只是重复，而不是变成我们希望的那样，这样在后续的操作中，容易出现逻辑错误。 df4 = pd.DataFrame({'val':[0,1,2,3,4,5,6,7,8,9,10,11],'A': ['A0', 'A1', 'A2', 'A3','A4', 'A5 阅读全文

posted @ 2018-09-24 09:32 静悟生慧阅读(1556) 评论(0) 推荐(0) 编辑

2018年9月21日

python pandas groupby

摘要：转自： https://blog.csdn.net/Leonis_v/article/details/51832916 pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键（可以是函数、数组或DataFrame列名）拆分p 阅读全文

posted @ 2018-09-21 19:58 静悟生慧阅读(3223) 评论(0) 推荐(0) 编辑

公告