随笔分类 - 练手练手
摘要:获取链家网所有城市 得到城市里所有的区域 爬取各区域里二手房的信息 分析热门城市二手房的价格(仅供参考) 项目地址: https://github.com/JiYu-NH/ErShouFang
阅读全文
摘要:Base64编码原理: https://blog.csdn.net/wo541075754/article/details/81734770 def Enbs64(s): # 编码后的结果 result = '' # 二进制数据 bin_data = '' # Base64编码对照表 bs64_ta
阅读全文
摘要:美拍链接:https://www.meipai.com/ 找到视频链接的标签,源代码中没有这个div 通过Fiddler抓包,找到class="mp-h5-player-layer-video"的div由哪个js文件生成的 打开对应的js文件,对其进行断点,找到src生成的方式 发现src参数在这个
阅读全文
摘要:利用推导式 old = [[1, 2], [3, 4], [5, 6]] # 从old中一个一个取出值,对取出的值(i)再进行一次遍历取值操作(也可以进行判断或者运算) new = [j for i in old for j in i] print(new)
阅读全文
摘要:JQuery轮播图 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>JQ轮播图</title> </head> <style> * { margin: 0; padding: 0; } li { list-s
阅读全文
摘要:JS轮播图 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>JS轮播图</title> </head> <style> * { margin: 0; padding: 0; } li { list-style
阅读全文
摘要:<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Practice</title> </head> <style> #register,#login{ width: 300px; height: 400px;
阅读全文
摘要:<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Practice</title> </head> <body> <form action="#" method="get"> 用户名:<input type="
阅读全文
摘要:求s=a+aa+aaa+aaaa+aa...a的值 其中a是一个数字,多少个数字相加由键盘输入控制 a = int(input("数字:")) count = int(input("个数:")) s = '' result = 0 for i in range(1, count + 1): # 第i
阅读全文
摘要:编程常用词汇 import requests import openpyxl from lxml import etree import re url = 'https://www.runoob.com/w3cnote/common-english-terminology-in-programmin
阅读全文
摘要:# 回文单词是从左到右和从右到左读相同的单词。 # 例如:“detartrated”和“evitative”是回文 str_in = input('Input:') # 方法一 count = 0 for i in range(len(str_in)): if str_in[i] == str_in
阅读全文
摘要:现有列表a, a中元素是如[x,y]格式的数组,代表一段数字区间, 如[1,3]表示从1到3之间的任何数字 判断给定的新数字区间new_element(例如: [10, 25])能不能添加到列表a中,返回True or False 要求任何被添加进入列表a的新数字区间,必须满足以下条件: 新插入的数
阅读全文
摘要:有序化 以小说章节目录的数字为文件名,一章一个文件(但上千章就得有上千个文件) 在每次获取小说章节里的内容时,给item添加新的标识,添加对应的章节的数字,全部存入数据库,然后根据这个数字标识排序取出数据即可(没打印小说内容的字段) 去空行 利用splitlines()和strip() str.sp
阅读全文
摘要:Hangman--游戏简介--> 百度百科 打印Hangman def printHangman(N): # 第一行 print("\t____") # 第二行 print("\t| |") # 第三行 print("\t| ", end="") if N > 0: # 第三行 第一笔 print(
阅读全文
摘要:下载 百度贴吧-动漫壁纸吧 所有图片 定义item Spider spider 只需要得到图片的url,必须以列表的形式给管道处理 class PictureSpiderSpider(scrapy.Spider): name = 'picture_spider' allowed_domains =
阅读全文
摘要:###利用sorted(iterable[, key][, reverse]) key:指定一个接收一个参数的函数,这个函数用于从每个元素中提取一个用于比较的关键字,默认值为None(直接比较元素) reverse:排序规则,reverse = True 降序 , reverse = False 升
阅读全文
摘要:查了下π的计算公式 分母都是奇数,第奇数个相加,第偶数个相减 计算次数越多越接近
阅读全文
摘要:1 import requests 2 import time 3 import json 4 import threading 5 # 采集https://careers.tencent.com/search.html 网站的招聘信息 6 7 # 时间戳 8 timestamp = '%d' %
阅读全文
摘要:百度贴吧、爬取帖子的标题、发布时间和链接 1 import threading 2 import requests 3 import re 4 import os 5 6 # 百度贴吧 爬取帖子的标题、发布时间和链接 7 8 # 要搜索的贴吧名称 9 word = '文字控吧' 10 # 设置爬取页
阅读全文
摘要:urllib下载图片 urllib3下载图片 Urllib下载图片 1 from urllib import request 2 import re 3 import os 4 5 # 妹子图首页 下载首页的几张 6 url = 'https://www.mzitu.com' 7 # Request
阅读全文