10 2021 档案
摘要:安装tesseract可参考在线中文字符识别网站(前后端分离 REST) 安装pytesseract模块来使用tesseract pip install pytesseract ###识别本地图片字符 中文英文据可以,但要清晰,指的是图片上只有文字,不然就要进行相关处理 from PIL impor
阅读全文
摘要:详情请看类属性和实例化属性 静态方法的语法是在定义函数的上一行添加一句“@staticmethod”不再有第一个默认参数"self",所以静态方法本身也不能调用成员变量和成员方法。静态方法不需要实例化之后使用,和类变量一样直接使用即可。类名.类属性;静态方法:类名.方法()。这里类名不需要加括号 类
阅读全文
摘要:该模块的具体代码https://www.cnblogs.com/wkhzwmr/p/15600330.html ##time()函数的前缀及函数 localtime mktime gmtime asctime ctime strftime strptime datetime ##其他相关的函数 sl
阅读全文
摘要:##创建进程模块的方法 ###os.system os.system是最简单创建进程的方法,参数只有一个,就是要执行的命令,如"dir",就类似于在cmd中输入的命令。 ###os.exec系列函数一共有8个。查看 ###os.fork os.fork函数调用系统API并创建子进程,但是fork函数
阅读全文
摘要:###输出1-100的所有偶数 采用取余即可 [i for i in range(1,101) if i % 2==0] ###数据库Redis有哪些基本类型 Redis支持五种数据类型: string(字符串) hash(哈希) list(列表) set(集合) zset(sorted set,有
阅读全文
摘要:###测试物理网路的ping 命令 -t :不断使用Ping命令发送回响请求信息到目的地。要中断并退出Ping,只需按下Ctrl+C组合键。 -a:指定对目的地IP地址进行反向名称解析,如解析成功,Ping将显示相应的主机名。 -n Count:指定发送回响请求消息的次数,默认值为4. -l Siz
阅读全文
摘要:Scrapy框架有两个主要的对象Reques与Response 具体内容看官网https://www.osgeo.cn/scrapy/topics/spider-middleware.html?highlight=%E4%B8%AD%E9%97%B4%E4%BB%B6 他们贯穿在爬虫的始终,最终爬虫
阅读全文
摘要:JSON是一种轻量级的数据交换格式,表示出来的是一个字符串,可以被所有语言读取。在Python中,JSON处理文件本质上就是一个编码、解码的过程。 JSON库中的dump和dumps方法实现JSON编码功能。区别是dump方法将编码后的数据存到文件中,而dumps方法产生一个JSON字符串 这里du
阅读全文
摘要:来自Scrapy 网络爬虫实战的阅读笔记 更多细节可看官网 编写爬虫 scrapy基本类组件说明 scrapy中的Selector选择器 Scrapy通用爬虫介绍与使用 ###Scrapy爬虫的主要实现 Scrapy主要通过Spider类来实现爬虫的相关功能,通俗来讲,Spider类定义了爬取某个或
阅读全文
摘要:##scrapy命令行介绍 scrapy提供了2种类型的命令,一种必须在scrapy项目种运行,称为项目命令;另一种则不需要在Scrapy项目中运行,称为全局命令。 ###全局命令有7个 startproject:创建项目 settings:设置信息 runspider:运行爬虫 shell:打开S
阅读全文
摘要:表的插入 第一种,直接写对应字段的值,若该字段有默认值或允许为空则该字段也可以不写 insert into tablename (values) 第二种 insert into tablename (字段values)(values) 表的更新 update tablename set 字段值 后面
阅读全文
摘要:原2021/10/9所写 ###基本选择器 一听名称就知道是最基础的选择器,所以要好好学,这里面主要有哪些内容呢 它的标准解释是基于元素的id,css样式类,元素名称等使用基于CSS的选择器机制查找页面元素。 那么这里的选择器就主要是: 元素名称,id,css样式类。这里还要加一个组合选择器,多个选
阅读全文
摘要:数据库 alter修改数据表中的元素的属性 只能after把表中的元素移动到后一位 alter table tabkename MODIFY 元素名 属性 AFTER 另一个元素名 修改表中的元素名 alter table tablename CHANGE 原元素名 修改的元素名 dtaetime;
阅读全文
摘要:Tornado实现聊天室的优化点 1.这个页面不可伸缩,只是个一直循环 2.并不能拉动页面条,查看页面上方的信息 3.登陆的用户没有固定的id,都是随机登录,登陆完之后就会退出 4.退出消息后并不能缓存下来消息,也就是消息没有保存到一个数据库中,并且没有登录用户之间的消息连接,每个用户都能够进入聊天
阅读全文
摘要:首先是拆解,这需要到鼠标底部去寻找螺丝钉,而螺丝钉一般都是藏在鼠标底部的某个标签,或者标记下的。所以要把哪个标签拆下。 然后转动螺丝,接着是组装 这里很关键,我组装之前总是喜欢把后面组装好,然后在挤压前面试图把鼠标压紧,但效果却差强人意,我挤压不了前面。 所以查了下资料,一般组装鼠标都是先把前面安装
阅读全文
摘要:###app.route()装饰器可以确定把装载在哪个url上 from flask import Flask app = Flask(name) @app.route('/') def hello_word(): return 'Hello World' if name == "main": ap
阅读全文
摘要:###链表中的node node是一个节点 它包含两样东西,一个是数据,一个是指针 数据设为val 指针设为next 每一个节点之间通过指针进行联系 node.next就是代表着下一个节点 node.next.val代表着下一个节点的val值 node.next.next代表着下下个节点 ###函数
阅读全文
摘要:Beautiful Soup库](https://www.cnblogs.com/wkhzwmr/p/15230635.html) Bequtiful会自动将输入的文档转化为Unicode编码,输出文档转化为UTF-8编码。一般在使用的过程中不需要考虑编码的问题,除非文档没有指定编码,这啥意思呢,是
阅读全文
摘要:来自lxml于xpath和文件存储 ###操作XML 读取XML文件,使用parse函数 就是 from lxml import etree tree = etree.parse('text.xml') ####转化成字符串形式的XML a = str(etree.tostring(tree,enc
阅读全文
摘要:requests包中并没有讲如何获取Cookie,而是讲了如何把cookie传进去 urllib讲了如何获取Cookie 首先创建http.cookiejar.Cookiejar类的实例a,然后再创建urllib.request.HTTPCookieProcessor类的实例b,并将a作为参数传入b
阅读全文
摘要:requests.cookies.RequestsCookieJar() jar.set(key,value) 这里要注意的是对Cookie的处理,怎么遍历和提取的 headers = { 'Host':'www.jianshu.com', 'User-Agent': 'Mozilla/5.0 (W
阅读全文
摘要:注:并不能统计子文件夹的文件个数,子文件夹被当做是一个文件 import os a = os.getcwd() #获取当前工作目录路径 print(a) import sys b = sys.argv[0] print(b) # 获取当前文件路径 print(sys.argv) # 返回的是个列表
阅读全文
摘要:来自图解LeetCode初级算法的笔记(分块查找没有研究) 为什么要查找 查找是搜索算法,可用在判断一个数是否在该数列种,或者找出一个无序数列中该数列的位置 ###顺序查找 就是将数列从头到尾的查找一遍 for i in rang(array): if array[i]==key: return i
阅读全文
摘要:###从下面的测算结果可以看出 列表生成器所花时间最少, +方法和append()方法所花时间差不多, 转化为列表可迭代对象所花时间最多 ###有两种测试所花时间的语法,但效果不一样,不知道为啥;这里我弄错了,第一项参数应该填的是表达式,而我在第二种方法种填了对象。所以导致所花时间不一样 这下面都是
阅读全文
摘要:s = 0 i = 1 while i <= 100: # # 偏C++编写分格 s +=i i +=1 print('求100以内的和',s) # 求100以内的和 5050 for i in range(101): #比较pythonic s += i print('求两个100以内的和',s)
阅读全文