摘要: 1、tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 其中带有dev的为开发版本,作者下载的版本为:tesseract-ocr-setup-3.05.01.exe 2、双击ex进行安装,同意协议并继续。 勾选Additional la 阅读全文
posted @ 2023-06-19 11:25 狗尾巴草oo 阅读(464) 评论(0) 推荐(0) 编辑
摘要: #定义拼接函数,并对字段进行去重 def concat_func(x): return pd.Series({ '爱好':'、'.join(x['爱好'].unique()) }) #分组聚合 + 拼接 df2 = df1.groupby(df1['姓名']).apply(concat_func). 阅读全文
posted @ 2022-05-25 11:58 狗尾巴草oo 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 1 def wrapper1(f1): 2 print('in wrapper1') 3 def inner1(*args,**kwargs): 4 print('in inner1') 5 ret = f1(*args,**kwargs) 6 print('111') 7 return ret 8 阅读全文
posted @ 2022-05-12 07:01 狗尾巴草oo 阅读(431) 评论(0) 推荐(0) 编辑
摘要: pandas.merge_ordered(left, right, on=None, left_on=None, right_on=None, left_by=None, right_by=None, fill_method=None, suffixes=('_x', '_y'), how='out 阅读全文
posted @ 2022-03-19 21:06 狗尾巴草oo 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 1、merge pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes= ('_x', 阅读全文
posted @ 2022-03-19 19:49 狗尾巴草oo 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 1、pivot方法 pandas.pivot(data, index=None, columns=None, values=None) (1)参数 data:DataFrame index:str or object or a list of str, optional。用于创建新DataFrame 阅读全文
posted @ 2022-03-16 17:27 狗尾巴草oo 阅读(601) 评论(0) 推荐(0) 编辑
摘要: 1、melt方法 pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True) (1)参数 frame:处理的数据集 id 阅读全文
posted @ 2022-03-15 14:18 狗尾巴草oo 阅读(667) 评论(0) 推荐(0) 编辑
摘要: 1、cut方法 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True) (1)参数 X:被切分的类 阅读全文
posted @ 2022-03-14 22:07 狗尾巴草oo 阅读(1965) 评论(0) 推荐(0) 编辑