摘要:
直接进入正题。 今天在进行一个socket编程时,遇到了如题这样的问题。 这个问题很常见,有的是爬虫方面的,五花八门的,查了一圈发现没有解决我的问题,接下来就分享下我遇到的问题和我的解决方案吧。 问题背景 环境:win10,Pycharm,python 今天在进行socket编程时,遇到上图的问题。 阅读全文
摘要:
如题,直接进入正文吧 Apache是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充,将Perl,Python解释器编译到服务器中。来自于 "百度百科" 之前弄了个 阅读全文
摘要:
顺承 "上节" ,本节,我们来介绍三类特征选择。 作为数据维数约简的重要手段之一,特征选择会从最初的特征集合中按照一定的规则删除冗余以及不重要的特征,从而获得一个最优特征集合的过程。 原始样本有$m$个特征,那么如果使用枚举法寻找最优特征子集的话,其复杂度为$2^m$,因为由$m$个特征构成子集数$ 阅读全文
摘要:
本节我们将介绍使用python识别一张图片中的内容,并试着得到一张表格,当然并不是类似于Excel的表格,而是该表格的markdown代码。 注:原创内容,转载请标明出处! 相关工具的安装 本次实验环境:win10,Pycharm2019.3。 安装相关库既可以使用命令行,也可以使用Pycharm自 阅读全文
摘要:
前言:本系列博客将介绍特征选择一系列相关的内容。 本节我们先简介特征工程中的三个组成部分。 特征工程 特征工程一般由特征构建,特征提取,特征选择三个部分组成。 特征工程的思维导图如下: "来源" 先约定一些符号: 设$D\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}$是一 阅读全文
摘要:
本节我们继续接着浅谈正则表达式(中)来讲正则表达式的其他使用。 反向引用 在之前的系列中讲到了捕获,我们知道:捕获会返回一个捕获组,这个分组是保存在内存中,不仅可以在正则表达式外部通过程序进行引用,也可以在正则表达式内部进行引用,这种引用方式就是反向引用。 根据捕获组的命名规则,反向引用可分为: 数 阅读全文
摘要:
本节我们继续接着浅谈正则表达式(上)来讲正则表达式的其他使用。 零宽断言 断言:俗话的断言就是“我断定什么什么”,而正则中的断言,就是说正则可以指明在指定的内容的前面或后面会出现满足指定规则的内容,意思正则也可以像人类那样断定什么什么。 比如"ss1aa2bb3", 正则可以用断言找出 aa2 前面 阅读全文
摘要:
之前写了一些字符串相关的题,但由于对正则表达式了解甚少,很多题写起来显得有些“冗余”,便开始学正则表达式了,因此分享下自己的学习心得吧。 正则表达式是什么 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为rege 阅读全文
摘要:
本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的矩阵表示形式,本节将介绍基于知识粒度属性约简定义和算法。 基于粗糙特征选择算法亦称为属性约简,其旨在保持数据集分类能力不变的前提下,通过约简冗余属性,最后得到问题的决策或分类规则。 相关定义 设决策信息系统$S=(U,A=C \bigcu 阅读全文
摘要:
本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的度量,本节将介绍知识粒度的矩阵表示形式。 我们先简单介绍矩阵的相关概念。 矩阵 先看矩阵的和,差。 矩阵的和: 若$A=(a_{ij})_{m \times n}$,$B=(b_{ij})_{m \times n}$是两个$m \time 阅读全文