04 2020 档案
摘要:Logging Scrapy提供了log功能,可以通过 logging 模块使用。 可以修改配置文件settings.py,任意位置添加下面两行,效果会清爽很多。 LOG_FILE = "TencentSpider.log" LOG_LEVEL = "INFO" Log levels Scrapy提
阅读全文
摘要:二分法查找 二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表
阅读全文
摘要:转载地址:https://blog.csdn.net/qq_42517220/article/details/88988910 什么是xpath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。 W3Scho
阅读全文
摘要:4.2 scrapy 中查找 HTML 元素 4.2.1 scrapy 的 xpath 简介 例 4-2-1: 使用 xpath 查找 HTML 中的元素 from scrapy.selector import Selector htmlText=''' <html><body> <bookstor
阅读全文
摘要:归并排序 归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。 将数组分解最小之后,然后合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。
阅读全文
摘要:快速排序 快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数
阅读全文
摘要:希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。 希尔排序的基本思想是:首先选择一个元素选择步长将数组划分为若干小组,对各个小组分别进行排序,然后不断将步长缩小,不断分组和排序,直到后的步长为1,对所有的元素进行排序,此时,经过前期的排序工作,能够减少全
阅读全文
摘要:基本思想:将一个记录插入到已排好序的序列中,从而得到一个新的有序序列(将序列的第一个数据看成是一个有序的子序列,然后从第二个记录逐个向该有序的子序列进行有序的插入,直至整个序列有序) (图片来源网络:https://www.jianshu.com/p/7cf0656e76dd)
阅读全文
摘要:选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。 1 #方法一,每次选出最大的放在右边 2
阅读全文
摘要:冒泡排序算法的运作如下: 比较相邻的元素。如果第一个比第二个大(升序),就交换他们两个。 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。 针对所有的元素重复以上的步骤,除了最后一个。 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比
阅读全文
摘要:一元回归: 1 import numpy as np 2 import matplotlib.pyplot as plt 3 import tensorflow as tf 4 5 #加载数据集 6 boston_housing = tf.keras.datasets.boston_housing
阅读全文
摘要:其中,GradientTape(persistent=False, watch_accessed_variables=False)有两个参数:persistent和watch_accessed_variables persistent: 布尔值,用来指定新创建的gradient tape是否是可持续
阅读全文
摘要:下面是一个梯度下降法对多元问题的求解: 1 import numpy as np 2 import matplotlib.pyplot as plt 3 plt.rcParams['font.sans-serif'] = ['Simhei'] 4 5 area = np.array([137.97,
阅读全文
摘要:首先导入数据,并且查看数据的样式 1 import pandas as pd 2 import matplotlib.pyplot as plt 3 file_path = './PM2.5/BeijingPM20100101_20151231.csv' 4 5 df = pd.read_csv(f
阅读全文
摘要:1 import time 2 3 #方法一: 4 class Solution: 5 def twoSum(self, nums, target): 6 for i in range(len(nums)): #第一次循环列表 7 for j in range(i+1,len(nums)): #第二
阅读全文
摘要:一些关于DataFrame类型和Series类型复合索引取元素的例子。
阅读全文