随笔分类 - python
摘要:要在 Python 中使用 py2neo 将新节点连接到已存在的节点标签,你可以执行以下步骤: 1. 导入所需的类和函数: ```python from py2neo import Graph, Node, Relationship ``` 2. 连接到 Neo4j 数据库: ```python g
阅读全文
摘要:## 前提 经过度娘得知,可以使用第三方包去重,但只管去重,你后面关系乱了人家第三方包不管。 或者 直接在neo4j里面使用数据库语言去重,但关系还是得重新建立。况且,我想用python去重。 干货来了 后来,我换了个思路,那么就是合并节点。(虽然跟去重差不多) 但总归总做出来了 使用NodeMat
阅读全文
摘要:## letter.py ```python import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from letterBeijing.i
阅读全文
摘要:## 1. Spider 核心思想是在parse方法中,返回新的Requests请求,代码如下 ```python import scrapy from hello_world.items import HelloWorldItem class MirSpider(scrapy.Spider): n
阅读全文
摘要:总结 scrapy startproject name scrapy genspider baidu http://www.baidu.com scrapy crawl baidu # 常用函数 response.text .body .xpath .extract 提取selector对象的dat
阅读全文
摘要:PyQt环境配置 PyQt5 及 pyqt5-tools 安装 直接pip安装即可: pip install PyQt5 pip install pyqt5-tools 建议使用国内源,进行快速安装: pip install -i https://pypi.tuna.tsinghua.edu.cn/
阅读全文
摘要:创建应用 from flask import Flask app = Flask(__name__) URL方法 URL方法不带参数 @app.route('/') def hello_world(): return 'Hello, World!' URL方法带参数 通过使用 <converter:
阅读全文
摘要:requests库 Requests 是 Python 的第三方库,它的安装非常简便,如下所示: python -m pip install requests Requests 库是在 urllib 的基础上开发而来,它使用 Python 语言编写,并且采用了 Apache2 Licensed(一种
阅读全文
摘要:在爬取网页时,由于会遇到登录问题而被阻止,此时通过改变头部信息来解决此问题 以爬取京东商品页面为例 1、 先登录京东账号 2、 摁F12进入调试页面,然后刷新页面,在Network栏中的第一行会出现一个document文件 3、 在那个文件上点右键,Copy→Copy as cURL(bash) 4
阅读全文
摘要:import matplotlib.pyplot as plt import matplotlib as mpl # 解决中文乱码问题 #sans-serif就是无衬线字体,是一种通用字体族。 #常见的无衬线字体有 Trebuchet MS, Tahoma, Verdana, Arial, Helv
阅读全文
摘要:在python里有一个非常烦人的问题就是给数组填充新值时,假如用append的方法,最终填充进数组的不是实际的值,而是类似于一个指针(比喻一下,和指针的差别还是很大的)如果原数组继续append数据,那么新数组也会跟着变化。就像下面这段程序: b = [] a = ['aaaaaaa'] b.app
阅读全文
摘要:Python中有join()和os.path.join()两个函数, 具体作用如下: join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串 os.path.join(): 将多个路径组合后返回,语法: os.path.join(path1[,pat
阅读全文
摘要:使用Selenium去获取token 首先说明该方案失败了。由于该网站是不需要登录的,我分析了所有的请求过程,没有找到服务端返回token的请求。最终还是抱着试一试的心态,使用selenium去打开了网站,然后获取了一下local storage和session storage的token值,返回的
阅读全文
摘要:前言 在练习爬虫的时候不清楚spa与ssr网站的区别,都使用bs4直接解析网页的html,结果ssr网站输出结果,spa网站却没有输出结果,特此记录 ssr网站:https://ssr1.scrape.center/page/1 spa网站:https://spa1.scrape.center/pa
阅读全文
摘要:代码 import pandas as pd df = pd.read_excel('temp.xlsx',index=False) # 读取需要转置的文件 df = df.T # 转置 # df.to_excel('abc.xlsx',header=False) # 另存为xlsx文件 df.to
阅读全文
摘要:1. 安装 pip install openpyxl 2. 打开文件 ① 创建 from openpyxl import Workbook # 实例化 wb = Workbook() # 激活 worksheet ws = wb.active ② 打开已有 from openpyxl import
阅读全文
摘要:https://scrape.center/ https://www.zhihu.com/question/36132174/answer/70798699
阅读全文
摘要:准备 下载库 在编写代码时需要使用的python库要提前下载 pip install beautifulsoup4 pip install openpyxl pip install requests 相关库的文档 openpyxl - 读/写 Excel 2010 xlsx/xlsm 文件的 Pyt
阅读全文
摘要:在看神经网络相关的论文时,总是能看到Epochs, Batchsize, Iterations 这些字眼,要弄明白这些专业术语,不得不先讲下梯度下降的概念。 梯度下降 梯度下降法是机器学习中经典的优化算法之一,用来求解复杂曲线的最小值。“梯度”是指某一函数在该点处的方向导数沿着该方向取得最大值,即函
阅读全文
摘要:参考 dlib提取人脸并保存 # -*- codeing: utf-8 -*- import sys import os import cv2 import dlib input_dir = './lfw' output_dir = './other_faces' size = 64 if not
阅读全文