摘要:
思路:使用 图像距离计算,然后 使用K近邻来分类。 使用像素点对应相减的方法(保留绝对值) 这样计算部分准确,部分错误。原因:不知道图像的主体 和 背景。 所以K近邻不适合做图像分类任务。 但神经网络能识别出来。 阅读全文
摘要:
概念 将图像组合成金字塔的形状(底下大,上面小) 使用场景:特征提取 方法分为 高斯金字塔 拉普拉斯金字塔 一、高斯金字塔 1、向下采样法(缩小) 越采样越少,down sample,|是一个缩小操作; 将 \(G_i\) 与高斯内核卷积 将所有偶数行和列去除 \(\frac{1}{16} * \l 阅读全文
摘要:
理论 图像阈值分割 利用图像中 要提取的目标区域 与 其背景 在 灰度特性 上的差异,把图像看作 具有不同灰度级的两类区域 (目标区域和背景区域)的组合。 选取一个比较合理的阈值,以确定图像中每个像素点 应该属于目标区域 还是背景区域,从而产生相应的二值图像。 阈值分割法的特点是:适用于 目标与背景 阅读全文
摘要:
理论 数学形态学(Mathematical morphology) 是一门建立在 格论 和 拓扑学 基础之上的图像分析学科,是 数学形态学图像处理 的基本理论。 其基本的运算包括:腐蚀和膨胀、开运算和闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换等。 阅读全文
摘要:
理论 伪彩色图像,目前主要用于 高度、压力、密度、湿度等,做彩色数据可视化。 HSV 色度、饱和度、亮度 示例 import cv2 import matplotlib.pyplot as plt img = cv2.imread('lena.jpg') img1 = cv2.applyColorM 阅读全文
摘要:
一、基本概念 在不改变图像的内容的前提下, 对图像的像素进行空间几何变化; 包括 图像的平移、镜像变换、缩放和旋转等; 假设原始图像的 f(x0, y0),经过几何变化产生的目标图像为 g(x1, y1), 则空间变换(映射)关系为: x1 = s(x0, y0) y1 = t(x0, y0) 那么 阅读全文
摘要:
一、颜色空间转换 cvtColor(src, code[, dst[, dstCn]]) → dst src:原始图像 code:转换的代码或者标识 返回值:已完成转换的图像 lena = cv2.imread('lena.jpg') lena_gray = cv2.cvtColor('lena.j 阅读全文
摘要:
色调 色彩外观的基本倾向,面熟了图像色彩模式下 原色的明暗程度; 范围 0-255,共 256 级色调; 对于灰度图,级别为255的时候,是白色; 级别为0 的时候,是黑色;中间是程度不同的灰色; 在 RGB 色彩空间中,色调代表的是红绿蓝三种原色的明暗程度; 以红色为例:有淡红、粉红、玫红、暗红等 阅读全文
摘要:
一、截取 ROI ROI : region of interest import cv2 img=cv2.imread('dj.jpg') # 封装方法来显示图片 def cv_show(img): cv2.imshow('w title',img) waitret = cv2.waitKey(20 阅读全文
摘要:
flutter 预研 目录flutter 预研开启 Mac 开发桌面应用Dart 语法demos 安装 https://www.jianshu.com/p/603649a02956 开启 Mac 开发桌面应用 Flutter 的 master 默认是关闭 桌面应用的,我们可以使用下面的命令开启: f 阅读全文
摘要:
关于 spaCy 官网:https://spacy.io 相比 NLTK spacy 速度更快 可以和深度学习结合 安装 (base) $ python -m spacy download en import spacy 加载英文模型,需要先安装模型 $ sudo python -m spacy d 阅读全文
摘要:
一、图像读写 1、读取 imread imread(filename[, flags]) → retval flags 相关参数 cv2.IMREAD_COLOR:彩色图像 cv2.IMREAD_GRAYSCALE:灰度图像 0,8位深度,1通道; 1,8位深度,3通道; 2,原深度,1通道 3,原 阅读全文
摘要:
像素 图片由一个个小格组成,这个小格叫做像素点; 一个像素,是一个很小的图像单元; 单元包含很多信息,其中最重要的就是颜色信息; 图像的颜色范围:0--255; 数值的变化代表颜色深浅的变化 一个像素点由三个值R、G、B组成,每个值的范围为 0--255,表示亮度; 颜色通道 单通道,如 灰度图,值 阅读全文
摘要:
怎么训练一个语言模型 1、 语料获取及预处理 billion words:https://github.com/ciprian-chelba/1-billion-word-language-modeling-benchmark 下载其 training-monolingual 语料 并使用 get_ 阅读全文
摘要:
文本相似 文本相似:一般是指的,某一文本 doc1与另一文本 doc2的相似程度。 一般可以从两个方面去考察两个文本之间的相似程度:形似(字面相似)和神似(语义相似)。当然这两种相似性也不能够完全割裂开来,只不过可以认为字面相似的文本不一定语义相似,语义相似的文本不一定用词相似。 为了考察文本的相似 阅读全文
摘要:
数据清洗 去掉多余空格 去掉不需要特殊字符 去掉一些网站等没用的东西 使用正则,stopwords import re from nltk.corpus import stopwords # 输入数据 s = ' RT @Amila #Test\nTom\'s newly listed Co &am 阅读全文
摘要:
一、停用词 stopwords 停用词:跟要做的实际主题不相关的文本,在 NPL任务中(信息检索、分类)毫无意义;通常情况下,冠词 和 代词都会被列为;一般歧义不大,移除后影响小。 一般情况下,给定语言的停用词都是人工制定,跨语料库,针对最常见单词的停用词表。停用词表可能使用网站上找到已有的,也可能 阅读全文
摘要:
词干提取 stemming 实现功能:如 eating, eaten, ate, eats > eat 一般词干提取器,移除 -s/es, -ing, -ed 这类事的准确度可以达到 70%; Porter 词干提取器,使用更多规则,精确度更高; Snowball 提取器,是一个提取家族,可以分别处 阅读全文
摘要:
一、标识化处理(分词/分句) 标识化处理:将原生字符串分割为一系列有意义的分词。 机器要理解的最小处理单位为单词。所以标识化处理外,不适合再做进一步的操作。 标识器(tokenizer): 1、split() 分割; 2、正则; 3、NLTK 内置方法:nltk.tokenize.word_toke 阅读全文
摘要:
关于 NLTK NLTK:Natural Language Toolkit 官网:http://www.nltk.org NLTK 模块简介 语言处理任务 NLTK模块 功能描述 获取和处理语料库 nltk.corpus 语料库和词典的标准化接口 字符串处理 nltk.tokenize, nltk. 阅读全文
摘要:
关于NLP NLP:Natural Language Processing 自然语言处理。 目的:计算机能‘懂得’人类对它‘说’的话,然后去执行一些指定的任务。 NLP任务分类 序列标注问题 命名实体 品牌词识别 拼写检查 中文分词(词性标注) 句法分析 新词发现 同义词查找&替换 关键词提取&搜索 阅读全文
摘要:
学习资源 官网 https://www.python.org 菜鸟 https://www.runoob.com/python3/python3-number.html 廖雪峰 https://www.liaoxuefeng.com/wiki/1016959663602400 codingdict 阅读全文
摘要:
关于字典 字典是另一种可变容器模型,且可存储任意类型对象。 字典对象的本质是,一个通过键值而非索引 存取的无序的、可迭代、可变的映射表。键必须互不相同。 字典 & 序列 序列是以连续的整数为索引;字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。 创建 字典的每个键值(key=>v 阅读全文
摘要:
模型误差 模型误差 = 偏差(Bias) + 方差(Variance) + 不可避免的误差 偏差方差权衡 Bias Variance Trade off 偏差 (Bias) 导致偏差的主要原因:对问题本身的假设不正确! 如:非线性数据 使用线性回归 欠拟合 方差(Variance) 数据的一点点扰动 阅读全文
摘要:
目录 官方 https://doc.qt.io/archives/qt-4.8/qwidget.html 银色的音色:QWidget控件学习总结 https://www.cnblogs.com/yinsedeyinse/p/10665007.html 阅读全文