摘要:
1、tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 其中带有dev的为开发版本,作者下载的版本为:tesseract-ocr-setup-3.05.01.exe 2、双击ex进行安装,同意协议并继续。 勾选Additional la 阅读全文
摘要:
#定义拼接函数,并对字段进行去重 def concat_func(x): return pd.Series({ '爱好':'、'.join(x['爱好'].unique()) }) #分组聚合 + 拼接 df2 = df1.groupby(df1['姓名']).apply(concat_func). 阅读全文
摘要:
1 def wrapper1(f1): 2 print('in wrapper1') 3 def inner1(*args,**kwargs): 4 print('in inner1') 5 ret = f1(*args,**kwargs) 6 print('111') 7 return ret 8 阅读全文
摘要:
pandas.merge_ordered(left, right, on=None, left_on=None, right_on=None, left_by=None, right_by=None, fill_method=None, suffixes=('_x', '_y'), how='out 阅读全文
摘要:
1、merge pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes= ('_x', 阅读全文
摘要:
1、pivot方法 pandas.pivot(data, index=None, columns=None, values=None) (1)参数 data:DataFrame index:str or object or a list of str, optional。用于创建新DataFrame 阅读全文
摘要:
1、melt方法 pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True) (1)参数 frame:处理的数据集 id 阅读全文
摘要:
1、cut方法 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True) (1)参数 X:被切分的类 阅读全文