2024年7月16日

kano模型

摘要: KANO模型是一种质量管理工具,用于帮助企业了解客户需求和期望。它由日本学者狩野纯提出,并于1984年首次发表。 KANO模型基于对产品或服务特性与客户满意度之间关系的理解。 它将客户需求分为五个类别: 基本要素(Basic Factors):这些是客户对产品或服务的基本要求,如果没有满足这些要求, 阅读全文

posted @ 2024-07-16 18:06 耀扬 阅读(62) 评论(0) 推荐(0) 编辑

2024年7月6日

语义角色标注(Semantic Role Labeling, SRL)

摘要: 语义角色标注(Semantic Role Labeling, SRL)是自然语言处理中一种重要的任务,旨在识别和标注句子中每个谓词(通常是动词)与其周围单词之间的语义角色关系。每个语义角色表示动作或事件中的不同参与者的角色或语义功能。下面是一些常见的语义角色标签及其含义: ARG0:表示动作的施事( 阅读全文

posted @ 2024-07-06 17:56 耀扬 阅读(88) 评论(0) 推荐(0) 编辑

词性标记(Part-of-Speech tags)

摘要: 在序列标注中,常见的词性标记(Part-of-Speech tags)用于标识单词的语法类别和语法功能。这些标记通常采用简短的缩写形式表示。以下是一些常见的词性标记及其含义: NNP - Proper noun, singular 表示专有名词,单数形式。例如:New York, Alice, Go 阅读全文

posted @ 2024-07-06 17:55 耀扬 阅读(41) 评论(0) 推荐(0) 编辑

IOB 格式(Inside-Outside-Beginning)介绍

摘要: 当使用 IOB 格式进行命名实体识别时,每个词汇都被标记为三种可能的情况之一:B-XXX、I-XXX 或 O。这里给出一个详细的例子来说明: 假设我们有以下句子: "John lives in New York City." 在这个例子中,如果我们要标注人名(PER)、地名(LOC)和其他(MISC 阅读全文

posted @ 2024-07-06 17:50 耀扬 阅读(28) 评论(0) 推荐(0) 编辑

2024年5月10日

微信电脑文件清理python程序

摘要: import os,re from itertools import combinations #两两组合 def combinations_iterative(elements): return list(combinations(elements, 2)) #将按照字符串长度升序排列 def s 阅读全文

posted @ 2024-05-10 10:21 耀扬 阅读(14) 评论(0) 推荐(0) 编辑

2024年4月25日

pdf合并

摘要: import PyPDF2 def merge_pdfs(input_pdfs, output_pdf): # 创建一个空的 PDF writer 对象 pdf_writer = PyPDF2.PdfWriter() # 遍历输入的 PDF 文件列表 for input_pdf in input_p 阅读全文

posted @ 2024-04-25 13:27 耀扬 阅读(10) 评论(0) 推荐(0) 编辑

2024年3月19日

猿人学19题关于ja3的curl_cffi库最终程序

摘要: 网上很多大佬对19题指纹技术进行了详细的描述。 https://zhuanlan.zhihu.com/p/601474166 唯独缺源码 from curl_cffi import requests session=requests.Session(impersonate="chrome120") 阅读全文

posted @ 2024-03-19 16:53 耀扬 阅读(96) 评论(0) 推荐(0) 编辑

2024年3月11日

实现Python pdf切割 ValueError: seek of closed file

摘要: 参考网上的教材,实现pdf文件的切割,提示一个问题 ValueError: seek of closed file 原来是pdf文件关闭导致的问题。 将其改成一个程序就解决了。 import PyPDF2 pdf_path = r'E:\zhuanxie\jpm\2.pdf' out_path =r 阅读全文

posted @ 2024-03-11 21:17 耀扬 阅读(377) 评论(0) 推荐(0) 编辑

2024年3月9日

最新版chromedriver下载与安装方法

摘要: chrome版本更新太快。 官网往往跟不上。 最新版本链接:https://googlechromelabs.github.io/chrome-for-testing/ 阅读全文

posted @ 2024-03-09 23:06 耀扬 阅读(534) 评论(0) 推荐(0) 编辑

2024年3月8日

谷歌浏览器调试xpath

摘要: ![](https://img2024.cnblogs.com/blog/1117808/202403/1117808-20240308124910460-562734842.png) 阅读全文

posted @ 2024-03-08 12:49 耀扬 阅读(51) 评论(0) 推荐(0) 编辑

2024年1月30日

利用pyautogui调用微信ocr

摘要: import pyautogui import time def ocrweixin(filename): # 鼠标点击,默认左键 #移至sheet页 pyautogui.click(1386,33) #点击 地址框 pyautogui.click(1364,94) pyautogui.hotkey 阅读全文

posted @ 2024-01-30 18:02 耀扬 阅读(210) 评论(0) 推荐(0) 编辑

Python调用微信OCR识别文字和坐标

摘要: python的ocr识别最方便的最准确的方法就是直接调微信的ocr 注意:调用的时候 先把微信关掉。 import os import json import time from wechat_ocr.ocr_manager import OcrManager, OCR_MAX_TASK_ID we 阅读全文

posted @ 2024-01-30 12:25 耀扬 阅读(1382) 评论(0) 推荐(0) 编辑

图片剪裁

摘要: from PIL import Image def crop_image(path, cropped_path): image = Image.open(path) cropped = image.crop((560, 460, 4040, 6100)) cropped.save(cropped_p 阅读全文

posted @ 2024-01-30 11:16 耀扬 阅读(4) 评论(0) 推荐(0) 编辑

pdf转图片

摘要: pip install PyMuPDF import fitz def pdf_image(pdfPath, imgPath, zoom_x, zoom_y, rotation_angle): # 打开PDF文件 pdf = fitz.open(pdfPath) # 逐页读取PDF for pg i 阅读全文

posted @ 2024-01-30 11:15 耀扬 阅读(7) 评论(0) 推荐(0) 编辑

将原pdf 拆解成独立的pdf

摘要: from PyPDF2 import PdfReader, PdfWriter file_reader = PdfReader("fsyy-en-cn.pdf") # getNumPages() 获取总页数 for page in range(len(file_reader.pages)): # 实 阅读全文

posted @ 2024-01-30 11:14 耀扬 阅读(15) 评论(0) 推荐(0) 编辑

导航