07 2019 档案
摘要:使用过程中都是错误,不是找不到训练数据,就是路径不对,还好最终解决 不用爬虫就可以图片转换文字了,爽~ 下面是步骤,一步一步来就行了,规避了错误的发生 1、如果是几张图片可以在线转 https://ocr.wdku.net/(这种在线的很多,也可以自己找) 2、如果是很多,可以用程序批量转 软件环境
阅读全文
摘要:有个任务需要抽取pdf中的图片,于是找了一个例子但是有错误,仅此记录下 错误1、 AttributeError: 'Document' object has no attribute 'getObjectString 解决方法:getObjectString 改成 _getXrefLength 错误
阅读全文
摘要:python中去掉字符串中某些不想要的字符: 1、一般的可以用replace() 这个函数不限定位置,是可以替换原来不想要的字符,替换成空 字符就相当于删除了 2、也可以用strip(),删除两边的字符(默认是删除左右空格) rstrip(),lstrip()这两个可以选择只删除左边或者右边 3、r
阅读全文
摘要:python默认迭代次数为996 需要修改才能迭代超过996 结果到1996报错 迭代次数扩展了1000,这个数字可以自定义。
阅读全文
摘要:本方案出自《storm应用实践:实时事务处理之策略》,简略的写了一部分,详细的方法就看书吧 1)集群中工作进程冲突: 解决:通过查看stormUI cluster summary中的free slots是否为零(为零表示新拓扑无法部署,没有可用空进程) 2)拓扑停止或者不执行: 一般是因为没有可用空
阅读全文
摘要:一、storm nimbus 单节点问题概述 1、storm集群在生产环境部署之后,通常会是如下的结构: 从图中可以看出zookeeper和supervisor都是多节点,任意1个zookeeper节点宕机或supervisor节点宕机均不会对系统整体运行造成影响,但nimbus和ui都是单节点。u
阅读全文
摘要:1、默认情况下: 1个supervisor节点启动4个worker进程。 每一个topology默认占用一个worker进程。 每个worker会启动executor。 每个executor默认启动一个task。 2、并行度 什么是并行度?在 Storm 的设定里,并行度大体分为3个方面: 一般来说
阅读全文