摘要:
NLP目前主要的技术: 1、分类算法:SVM、朴素贝叶斯、K近邻、决策树、集成学习(原理和应用) 2、聚类算法:kmeans、层次聚类、密度聚类(原理和应用) 3、概率图模型HMM、CRF(原理和应用) 4、LDA、PLSA、LSA(原理和应用) 5、半监督学习(算法思想) 6、新词发现(技术实现细 阅读全文
摘要:
jieba具有对分词的词性进行标注的功能,词性类别如下: 阅读全文
摘要:
Tensorboard查看训练状态等等,在Windows环境下涉及到路径的问题, 如果工程文件在c盘,一路cd到训练数据所在文件夹, 如果在其他磁盘,先转到所在盘,再cd到所在文件夹,然后打开cmd,输入:tensorboard --logdir=tensorboard_graph --host=l 阅读全文
摘要:
1、tensorflow的基本运作 为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: 其中tf.mul(a, b)函数便是tf的一个基本的算数运算,接下来介绍跟多的相关函数。 2、tf函数 TensorFlow的算术操作如下: 张量操作Tensor Transformations 阅读全文
摘要:
作为计算机视觉开发者,使用TensorFlow进行简单的图像处理是基本技能,而TensorFlow在tf.image包中支持对图像的常见的操作包括: 亮度调整 对比度调整 饱和度调整 图像采样插值放缩 色彩空间转换 Gamma校正 标准化 图像的读入与显示我们通过OpenCV来实现,这里需要注意一点 阅读全文
摘要:
Numpy 练习 import numpy as np import scipy.stats as ss def case(n , mu , sigma , p , rep ): m = np.zeros((rep, 4)) for i in range(rep): norm = np.random 阅读全文
摘要:
目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数) 2.3 发散程度(极差,方差、标准差、变异系数) 2.4 偏差程度(z-分数) 2.5 相关程度(协方差,相关系数) 2.6 回顾3 使用Matplotlib进行图分析 阅读全文
摘要:
python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。 总是记不住API。昨晚写的时候用到了一些,但是时长会忘记,于是就简单的整理一下: 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目录名:os.lis 阅读全文
摘要:
从我们见到的各种图像识别软件来看,机器似乎能认出人脸、猫、狗、花草、各种汽车等等日常生活中出现的物体,但实际上,这有一个前提:你要用这些类别的图像,对它进行过训练。 确切地说,该叫它“图像分类”。 建立一个图像分类器并不复杂,技术博客Source Dexter上最近发表的一篇文章,介绍了该如何快速用 阅读全文
摘要:
目录 读取数据 索引 选择数据 简单运算 import pandas as pd read_csv to_csv 数据框操作 一 创建对象 二 查看数据 三 选择 四 缺失值处理 五 相关操作 六 合并 七 分组 八 Reshaping 九 时间序列 十 Categorical 十一 画图 十二 导 阅读全文