2018 年 7月随笔档案 - 蔡军帅

摘要：预测结果为1到11中的1个首先加载数据，训练数据，训练标签，预测数据，预测标签：if __name__=="__main__": importTrainContentdata() ... 阅读全文

posted @ 2018-07-31 11:43 蔡军帅阅读(154) 评论(0) 推荐(0) 编辑

摘要：预测结果为1到11中的1个首先加载数据，训练数据，训练标签，预测数据，预测标签：其中训练数据，预测数据是csv文件格式，而且是str，要转为float并一排排放入lis，然后将所有lis放入traindata或testdata中，但csv中是以","隔开的，所以要将"\t"等都转为","，需要利阅读全文

posted @ 2018-07-31 11:43 蔡军帅阅读(1711) 评论(0) 推荐(0) 编辑

sklearn中的predict与predict_proba的区别（得到各条记录每个标签的概率（支持度））

摘要：假定在一个k分类问题中，测试集中共有n个样本。则： predict返回的是一个大小为n的一维数组，一维数组中的第i个值为模型预测第i个预测样本的标签； predict_proba返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。此时每一行的和应该等于1。举阅读全文

posted @ 2018-07-30 17:36 蔡军帅阅读(3844) 评论(0) 推荐(0) 编辑

python稀疏矩阵得到每列最大k项的值，对list内为类对象的排序(scipy.sparse.csr.csr_matrix)...

摘要：print(train_set.tdm) print(type(train_set.tdm))输出得到： (0, 3200) 0.264940780338 (0, 1682) ... 阅读全文

posted @ 2018-07-24 19:41 蔡军帅阅读(247) 评论(0) 推荐(0) 编辑

python稀疏矩阵得到每列最大k项的值，对list内为类对象的排序(scipy.sparse.csr.csr_matrix)

摘要：输出得到：说明这个变量train_set.tdm是个scipy.sparse.csr.csr_matrix，类似稀疏矩阵，输出得到的是矩阵中非0的行列坐标及值，现在我们要挑出每一行中值最大的k项。首先我们知道一个对于稀疏矩阵很方便函数：输出为：最后就是输出到excel中就如下所示：阅读全文

posted @ 2018-07-24 19:41 蔡军帅阅读(3084) 评论(0) 推荐(0) 编辑

python中scipy学习——随机稀疏矩阵及操作

摘要：1.生成随机稀疏矩阵：scipy中生成随机稀疏矩阵的函数如下：scipy.sparse.rand(m,n,density,format,dtype,random_state)1参数介绍：参数含义m,n整型... 阅读全文

posted @ 2018-07-23 23:43 蔡军帅阅读(261) 评论(0) 推荐(0) 编辑

python中scipy学习——随机稀疏矩阵及操作

摘要：1.生成随机稀疏矩阵： scipy中生成随机稀疏矩阵的函数如下： 1 参数介绍：例子代码如下： 2.稀疏矩阵的操作：输出结果如下：注：更多参考请查看docs.scipy.org 阅读全文

posted @ 2018-07-23 23:43 蔡军帅阅读(5498) 评论(0) 推荐(0) 编辑

ptyhon中文本挖掘精简版

摘要：import xlrdimport jiebaimport sys import importlibimport os #python内置的包，用于进行文件目录操作，我们将会用到os.listd... 阅读全文

posted @ 2018-07-23 12:25 蔡军帅阅读(107) 评论(0) 推荐(0) 编辑

ptyhon中文本挖掘精简版

摘要：import xlrd import jieba import sys import importlib import os #python内置的包，用于进行文件目录操作，我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文

posted @ 2018-07-23 12:25 蔡军帅阅读(175) 评论(0) 推荐(0) 编辑

[python] 使用scikit-learn工具计算文本TF-IDF值

摘要：在文本聚类、文本分类或者比较两个文档相似程度过程中，可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具：scikit-learn。希望文章对你有所帮... 阅读全文

posted @ 2018-07-23 11:06 蔡军帅阅读(203) 评论(0) 推荐(0) 编辑

[python] 使用scikit-learn工具计算文本TF-IDF值

摘要：在文本聚类、文本分类或者比较两个文档相似程度过程中，可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具：scikit-learn。希望文章对你有所帮助，相关文章如下： [python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒 Python 阅读全文

posted @ 2018-07-23 11:06 蔡军帅阅读(1971) 评论(0) 推荐(0) 编辑

python高手的自修课

摘要：python高手的自修课作者：相国大人目录0.第0课：前言与参考文献目标读者：具有一定python基础的编程爱好者。本系列博文为了尽可能少说废话，凡是能够用代码表达的，都尽量直接用代码。读者可... 阅读全文

posted @ 2018-07-23 10:51 蔡军帅阅读(93) 评论(0) 推荐(0) 编辑

python高手的自修课

摘要：目录 0.第0课：前言与参考文献目标读者：具有一定python基础的编程爱好者。本系列博文为了尽可能少说废话，凡是能够用代码表达的，都尽量直接用代码。读者可以运行相应的代码来理解python的一些细节和技巧。参考文献本系列博文主要内容是对一系列博主阅读过的书籍、博客的总结和概括。其中蓝本是阅读全文

posted @ 2018-07-23 10:51 蔡军帅阅读(374) 评论(0) 推荐(0) 编辑

sklearn: TfidfVectorizer 中文处理及一些使用参数

摘要：TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵，从而为后续的文本相似度计算，主题模型，文本搜索排序等一系列应用奠定基础。基本应用如：#coding=utf-8from sklea... 阅读全文

posted @ 2018-07-22 22:40 蔡军帅阅读(153) 评论(0) 推荐(0) 编辑

sklearn: TfidfVectorizer 中文处理及一些使用参数

摘要：TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵，从而为后续的文本相似度计算，主题模型，文本搜索排序等一系列应用奠定基础。基本应用如： https://blog.csdn.net/blmoistawinde/article/details/80816179 阅读全文

posted @ 2018-07-22 22:40 蔡军帅阅读(5579) 评论(0) 推荐(0) 编辑

python在文件中输入整数

摘要：a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) ... 阅读全文

posted @ 2018-07-22 15:28 蔡军帅阅读(145) 评论(0) 推荐(0) 编辑

python在文件中输入整数

摘要：a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) a.append(int(test_set.label[i][0])) f=open('F:/goverment/ArticleMining/predict.txt'... 阅读全文

posted @ 2018-07-22 15:28 蔡军帅阅读(1918) 评论(0) 推荐(0) 编辑

Python文件操作，with open as追加文本内容实例

摘要：最常见的读写操作import rewith open('/Users/Mr.Long/Desktop/data.txt', 'w') as f: f.write('hello world')就这样就完... 阅读全文

posted @ 2018-07-22 11:31 蔡军帅阅读(1503) 评论(0) 推荐(0) 编辑

Python文件操作，with open as追加文本内容实例

摘要：最常见的读写操作就这样就完成了文件的写操错（此处用with的格式，可以节省很多不必要的麻烦）读操作同理，只是做一下微小的变化处理而已一些正则表达式的关键词 w：以写方式打开， w：以写方式打开， a：以追加模式打开 (从 EOF 开始, 必要时创建新文件) a：以追加模式打开 (从 EOF 开阅读全文

posted @ 2018-07-22 11:31 蔡军帅阅读(519) 评论(0) 推荐(0) 编辑

Python中的Bunch模式

摘要：引用：当树这样的数据结构被原型化（或者乃至于被定型）时，它往往会时一个非常有用而灵活的类型，允许我们在其构造器中设置任何属性。在这些情况下，我们会需要用到一种叫做“Bunch”的设计模式。... 阅读全文

posted @ 2018-07-22 11:22 蔡军帅阅读(725) 评论(0) 推荐(0) 编辑

Python中的Bunch模式

摘要：引用：当树这样的数据结构被原型化（或者乃至于被定型）时，它往往会时一个非常有用而灵活的类型，允许我们在其构造器中设置任何属性。在这些情况下，我们会需要用到一种叫做“Bunch”的设计模式。由于这个类直接继承dict类，所以我们可以自然而然地获得dict类地大量功能，比如对键/值的遍历，或者简单查阅读全文

posted @ 2018-07-22 11:22 蔡军帅阅读(445) 评论(0) 推荐(0) 编辑

python文本挖掘模版

摘要：import xlrdimport jiebaimport sys import importlibimport os #python内置的包，用于进行文件目录操作，我们将会用到os.listd... 阅读全文

posted @ 2018-07-22 10:21 蔡军帅阅读(190) 评论(0) 推荐(0) 编辑

python文本挖掘模版

摘要：import xlrd import jieba import sys import importlib import os #python内置的包，用于进行文件目录操作，我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文

posted @ 2018-07-22 10:21 蔡军帅阅读(1807) 评论(0) 推荐(0) 编辑

使用Apriori算法和FP-growth算法进行关联分析

摘要：目录1. 关联分析2. Apriori原理3. 使用Apriori算法来发现频繁集4. 使用FP-growth算法来高效发现频繁项集5. 示例：从新闻网站点击流中挖掘新闻报道扩展阅读系列文章：《机器学习实... 阅读全文

posted @ 2018-07-16 11:46 蔡军帅阅读(266) 评论(0) 推荐(0) 编辑

使用Apriori算法和FP-growth算法进行关联分析

摘要：目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP-growth算法来高效发现频繁项集 5. 示例：从新闻网站点击流中挖掘新闻报道扩展阅读目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP 阅读全文

posted @ 2018-07-16 11:46 蔡军帅阅读(548) 评论(0) 推荐(0) 编辑

带你搞懂朴素贝叶斯分类算法

摘要：带你搞懂朴素贝叶斯分类算法带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单，也是常见的一种分类方法。这篇... 阅读全文

posted @ 2018-07-16 11:41 蔡军帅阅读(177) 评论(0) 推荐(0) 编辑

带你搞懂朴素贝叶斯分类算法

摘要：带你搞懂朴素贝叶斯分类算法带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单，也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法，希望有利于他人理解。 1 阅读全文

posted @ 2018-07-16 11:41 蔡军帅阅读(7890) 评论(0) 推荐(1) 编辑

[Machine Learning & Algorithm] 随机森林（Random Forest）

摘要：http://www.cnblogs.com/maybe2030/p/4585705.html阅读目录1 什么是随机森林？2 随机森林的特点3 随机森林的相关基础知识4 随机森林的生成5 袋外错误率（oo... 阅读全文

posted @ 2018-07-16 11:17 蔡军帅阅读(216) 评论(0) 推荐(0) 编辑

[Machine Learning & Algorithm] 随机森林（Random Forest）

摘要：http://www.cnblogs.com/maybe2030/p/4585705.html 阅读目录 1 什么是随机森林？ 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率（oob error） 6 随机森林工作原理解释的一个简单例子 7 随机森林的Python 阅读全文

posted @ 2018-07-16 11:17 蔡军帅阅读(482) 评论(0) 推荐(0) 编辑

随机森林入门攻略（内含R、Python代码）

摘要：简介近年来，随机森林模型在界内的关注度与受欢迎程度有着显著的提升，这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去，从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中，随机森林一... 阅读全文

posted @ 2018-07-16 11:06 蔡军帅阅读(255) 评论(0) 推荐(0) 编辑

随机森林入门攻略（内含R、Python代码）

摘要：简介近年来，随机森林模型在界内的关注度与受欢迎程度有着显著的提升，这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去，从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中，随机森林一次又一次地展示出令人难以置信的强大，而与此同时它又是如此的方便实用。需要大家注意的是，在上文阅读全文

posted @ 2018-07-16 11:06 蔡军帅阅读(9450) 评论(0) 推荐(0) 编辑

python多标签分类模版

摘要：1 from sklearn.multioutput import MultiOutputClassifier 2 from sklearn.ensemble import RandomForestClassifier 3 from sklearn.ensemble import ExtraTreesClassifier 4 import numpy as np 5 from... 阅读全文

posted @ 2018-07-15 22:40 蔡军帅阅读(4414) 评论(0) 推荐(0) 编辑

Win10 TensorFlow（gpu）安装详解

摘要：Win10 TensorFlow（gpu）安装详解写在前面：TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor（张量）意味着N维数... 阅读全文

posted @ 2018-07-06 13:18 蔡军帅阅读(170) 评论(0) 推荐(0) 编辑

Win10 TensorFlow（gpu）安装详解

摘要：Win10 TensorFlow（gpu）安装详解写在前面：TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor（张量）意味着N维数组，Flow（流）意味着基于数据流图的计算，TensorFlow为张量从图象的一端流动到另一端阅读全文

posted @ 2018-07-06 13:18 蔡军帅阅读(6516) 评论(0) 推荐(0) 编辑

PAT甲级 1002 A+B for Polynomials (25)（25 分）

摘要：1002 A+B for Polynomials (25)（25 分）This time, you are supposed to find A+B where A and B are two polynomia... 阅读全文

posted @ 2018-07-05 19:47 蔡军帅阅读(78) 评论(0) 推荐(0) 编辑

PAT甲级 1002 A+B for Polynomials (25)（25 分）

摘要：This time, you are supposed to find A+B where A and B are two polynomials. Input Each input file contains one test case. Each case occupies 2 lines, a 阅读全文

posted @ 2018-07-05 19:47 蔡军帅阅读(293) 评论(0) 推荐(0) 编辑

二叉搜索树的操作集（30 分）

摘要：6-12 二叉搜索树的操作集（30 分）本题要求实现给定二叉搜索树的5种常用操作。函数接口定义：BinTree Insert( BinTree BST, ElementType X );BinTree D... 阅读全文

posted @ 2018-07-03 00:20 蔡军帅阅读(149) 评论(0) 推荐(0) 编辑

二叉搜索树的操作集（30 分）

摘要：本题要求实现给定二叉搜索树的5种常用操作。函数接口定义： BinTree Insert( BinTree BST, ElementType X ); BinTree Delete( BinTree BST, ElementType X ); Position Find( BinTree BST, 阅读全文

posted @ 2018-07-03 00:20 蔡军帅阅读(361) 评论(0) 推荐(0) 编辑

欢迎参观蔡军帅的博客！！！

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论