摘要:1.通用爬虫:搜索引擎用的爬虫系统。搜索引擎和供应商提供的爬虫。 通用爬虫要遵循规则:Robots协议 通用爬虫工作流程: 爬取网页》存储数据》内容处理》提供检索 通用爬虫缺点: 只能提供和文本相关的内容如html、world、pdf等,不能提供多媒体文件如音乐、图片、视频和二进制文件(脚本、程序) 提供的结果千篇一律,针对不同领域提供不同内容 不能提供人类语义上的检索 通用爬虫局...
阅读全文
|
随笔分类 - 知识点归纳
摘要:1.通用爬虫:搜索引擎用的爬虫系统。搜索引擎和供应商提供的爬虫。 通用爬虫要遵循规则:Robots协议 通用爬虫工作流程: 爬取网页》存储数据》内容处理》提供检索 通用爬虫缺点: 只能提供和文本相关的内容如html、world、pdf等,不能提供多媒体文件如音乐、图片、视频和二进制文件(脚本、程序) 提供的结果千篇一律,针对不同领域提供不同内容 不能提供人类语义上的检索 通用爬虫局...
阅读全文
摘要:#### post 请求需要发送一个header setRequestHeader('Content-Type','application/x-www-form-urlencoded') post请求的参数必须写在 send 内部 #### 如果http的状态200(请求成功),xhr的状态是4(成
阅读全文
摘要:***网络编程就是,让在不同的电脑上的软件能够进行数据传递,即进程之间的通信 ***子网掩码: 1.子网掩码不能单独存在,它必须结合IP地址一起使用。 2.子网掩码只有一个作用,就是将某个IP地址划分成网络地址和主机地 址两部分子网掩码的设定必须遵循一定的规则。 3.与IP地址相同,子网掩码的长度也
阅读全文
摘要:****全局变量: 进程 对于全局变量都各自有一个线程 共享一个全局变量,但操作全局变量有问题,容易造成混乱一个线程未结束直接运行另一个线程。导致出错。 ***多线程的一些问题: 多线程程序的执行顺序是不确定的。当执行到sleep语句时,线程将被阻塞(Blocked),到sleep结束后,线程进入就
阅读全文
摘要:####传递 数字,字符串,布尔值,元组(其他都是可变的) 不可变类型传递后,一方进行了修改,不影响另一方 可变类型传递后,一方修改了,影响另一方 ####私有化 私有的属性,不能通过对象直接访问,但是可以通过方法访问 私有的方法,不能通过对象直接访问 私有的属性、方法,不会被子类继承,也不能被访问
阅读全文
摘要:如果一个函数在内部不调用其它的函数,而是自己本身的话,这个函数就是递归函数。满足递归的条件: 有循环的内容 有跳出的条件递归默认是有递归深度要求的。 递归优缺点: 优点:代码简洁,好理解 缺点:占用内存大,运行速度慢 一般能用递归的,都能用循环解决,反之,不一定建议,使用循环来代替递归
阅读全文
摘要:1 #for 循环遍历一个字符串排除一些条件并获得一个新字符串 先设一个空字符串 再依次累加到空字符串中去得到结果。 C='' str=input('请输入一个字符串:') for i in range(0,len(str)): if str[i].isdigit()==False: C=C+str
阅读全文
摘要:1#如果键存在,就是修改。否则是新增 #根据键删除,并返回对应的值info = { 'name':'维克托', 'sex':'男', 'hobby':'激光', }info['sex']='女'print(info)print('*'*100)ret=info.pop('name')print(re
阅读全文
摘要:1。不可变:数字,字符串,布尔值,元组(其他都是可变的)不可变类型传递后,一方进行了修改,不影响另一方可变类型传递后,一方修改了,影响另一方 2.Python的元组与列表类似,不同之处在于元组的元素不能修改 set是一个无序,不能重复的集合容器,所以可以用来过滤重复元素
阅读全文
摘要:####CS 与 BS 结构 C/S 结构软件:客户端(Client)服务器(Server)软件,客户端需要单独下载安装之后,才能正常操作的软件 B/S 结构软件:浏览器(Browser)服务器(Server)软件,客户端不需要下载安装,只需要用户的电脑上安装有浏览器就可以正常使用软件的全部功能 #
阅读全文
|