09 2019 档案
摘要:降维实际上就是降低特征的个数,最终的结果就是特征和特征之间不相关。 降维:降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 降维的两种方式: 1、特征选择 2、主成分分析(可以理解为一种特征提取的方式) 一、特征选择 特征选择的2中方法(过滤式 + 嵌入式) 模块
阅读全文
摘要:目标: 了解数值型数据、类别型数据特点 应用MinMaxScaler实现对特征数据归一化 应用StandarScaler实现对特征数据进行标准化 目标: 了解数值型数据、类别型数据特点 应用MinMaxScaler实现对特征数据归一化 应用StandarScaler实现对特征数据进行标准化 目标:
阅读全文
摘要:方法一:CountVectorizer方法进行特征提取 from sklearn.feature.extraction.text import CountVectorizer 这个方法根据分词进行数量统计继续文本分类 文本特征提取 作用:对文本进行特征值化 sklearn.feature_extra
阅读全文
摘要:format()格式化输出 format():把传统的%替换为{}来实现格式化输出 format()常见的用法: 其实就是format()后面的内容,填入大括号中 看懂代码还需要了解format()这些用法: 引导符号(标识后面特殊格式) >右对齐 <左对齐 ^居中 浮点数小数部分精度或字符长度(如
阅读全文
摘要:#coding=utf-8 #!/usr/bin/python import sys, re, collections #读入文件 def read_file(filename): try: fp = open(filename) text = fp.read() except IOError: print ("Error opening or reading input file: ",file
阅读全文
摘要:1 public class Queue { 2 //队首指针 3 private int front; 4 //队尾指针 5 private int rear; 6 //数组 7 private int[] arr; 8 //数组最大长度 9 private int maxSize; 10 11 //初始化队列长度 12 public Queue(int maxSize){ 13 this.ma
阅读全文