随笔 - 1659  文章 - 0  评论 - 100  阅读 - 188万
07 2018 档案
python多分类预测模版,输出支持度,多种分类器,str的csv转float
摘要:预测结果为1到11中的1个首先加载数据,训练数据,训练标签,预测数据,预测标签:if __name__=="__main__": importTrainContentdata() ... 阅读全文
posted @ 2018-07-31 11:43 蔡军帅 阅读(154) 评论(0) 推荐(0) 编辑
python多分类预测模版,输出支持度,多种分类器,str的csv转float
摘要:预测结果为1到11中的1个 首先加载数据,训练数据,训练标签,预测数据,预测标签: 其中训练数据,预测数据是csv文件格式,而且是str,要转为float并一排排放入lis,然后将所有lis放入traindata或testdata中,但csv中是以","隔开的,所以要将"\t"等都转为",",需要利 阅读全文
posted @ 2018-07-31 11:43 蔡军帅 阅读(1711) 评论(0) 推荐(0) 编辑
sklearn中的predict与predict_proba的区别(得到各条记录每个标签的概率(支持度))
摘要:假定在一个k分类问题中,测试集中共有n个样本。则: predict返回的是一个大小为n的一维数组,一维数组中的第i个值为模型预测第i个预测样本的标签; predict_proba返回的是一个n行k列的数组,第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。此 时每一行的和应该等于1。 举 阅读全文
posted @ 2018-07-30 17:36 蔡军帅 阅读(3844) 评论(0) 推荐(0) 编辑
python稀疏矩阵得到每列最大k项的值,对list内为类对象的排序(scipy.sparse.csr.csr_matrix)...
摘要:print(train_set.tdm) print(type(train_set.tdm))输出得到: (0, 3200) 0.264940780338 (0, 1682) ... 阅读全文
posted @ 2018-07-24 19:41 蔡军帅 阅读(247) 评论(0) 推荐(0) 编辑
python稀疏矩阵得到每列最大k项的值,对list内为类对象的排序(scipy.sparse.csr.csr_matrix)
摘要:输出得到: 说明这个变量train_set.tdm是个scipy.sparse.csr.csr_matrix,类似稀疏矩阵,输出得到的是矩阵中非0的行列坐标及值,现在我们要挑出每一行中值最大的k项。 首先我们知道一个对于稀疏矩阵很方便函数: 输出为: 最后就是输出到excel中 就如下所示: 阅读全文
posted @ 2018-07-24 19:41 蔡军帅 阅读(3084) 评论(0) 推荐(0) 编辑
python中scipy学习——随机稀疏矩阵及操作
摘要:1.生成随机稀疏矩阵:scipy中生成随机稀疏矩阵的函数如下:scipy.sparse.rand(m,n,density,format,dtype,random_state)1参数介绍:参数含义m,n整型... 阅读全文
posted @ 2018-07-23 23:43 蔡军帅 阅读(261) 评论(0) 推荐(0) 编辑
python中scipy学习——随机稀疏矩阵及操作
摘要:1.生成随机稀疏矩阵: scipy中生成随机稀疏矩阵的函数如下: 1 参数介绍: 例子 代码如下: 2.稀疏矩阵的操作: 输出结果如下: 注:更多参考请查看docs.scipy.org 阅读全文
posted @ 2018-07-23 23:43 蔡军帅 阅读(5498) 评论(0) 推荐(0) 编辑
ptyhon中文本挖掘精简版
摘要:import xlrdimport jiebaimport sys import importlibimport os #python内置的包,用于进行文件目录操作,我们将会用到os.listd... 阅读全文
posted @ 2018-07-23 12:25 蔡军帅 阅读(107) 评论(0) 推荐(0) 编辑
ptyhon中文本挖掘精简版
摘要:import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文
posted @ 2018-07-23 12:25 蔡军帅 阅读(175) 评论(0) 推荐(0) 编辑
[python] 使用scikit-learn工具计算文本TF-IDF值
摘要:在文本聚类、文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn。 希望文章对你有所帮... 阅读全文
posted @ 2018-07-23 11:06 蔡军帅 阅读(203) 评论(0) 推荐(0) 编辑
[python] 使用scikit-learn工具计算文本TF-IDF值
摘要:在文本聚类、文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn。 希望文章对你有所帮助,相关文章如下: [python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒 Python 阅读全文
posted @ 2018-07-23 11:06 蔡军帅 阅读(1971) 评论(0) 推荐(0) 编辑
python高手的自修课
摘要:python高手的自修课 作者:相国大人 目录0.第0课:前言与参考文献 目标读者: 具有一定python基础的编程爱好者。本系列博文为了尽可能少说废话,凡是能够用代码表达的,都尽量直接用代码。读者可... 阅读全文
posted @ 2018-07-23 10:51 蔡军帅 阅读(93) 评论(0) 推荐(0) 编辑
python高手的自修课
摘要:目录 0.第0课:前言与参考文献 目标读者: 具有一定python基础的编程爱好者。 本系列博文为了尽可能少说废话,凡是能够用代码表达的,都尽量直接用代码。读者可以运行相应的代码来理解python的一些细节和技巧。 参考文献 本系列博文主要内容是对一系列博主阅读过的书籍、博客的总结和概括。其中蓝本是 阅读全文
posted @ 2018-07-23 10:51 蔡军帅 阅读(374) 评论(0) 推荐(0) 编辑
sklearn: TfidfVectorizer 中文处理及一些使用参数
摘要:TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如:#coding=utf-8from sklea... 阅读全文
posted @ 2018-07-22 22:40 蔡军帅 阅读(153) 评论(0) 推荐(0) 编辑
sklearn: TfidfVectorizer 中文处理及一些使用参数
摘要:TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如: https://blog.csdn.net/blmoistawinde/article/details/80816179 阅读全文
posted @ 2018-07-22 22:40 蔡军帅 阅读(5579) 评论(0) 推荐(0) 编辑
python在文件中输入整数
摘要:a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) ... 阅读全文
posted @ 2018-07-22 15:28 蔡军帅 阅读(145) 评论(0) 推荐(0) 编辑
python在文件中输入整数
摘要:a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) a.append(int(test_set.label[i][0])) f=open('F:/goverment/ArticleMining/predict.txt'... 阅读全文
posted @ 2018-07-22 15:28 蔡军帅 阅读(1918) 评论(0) 推荐(0) 编辑
Python文件操作,with open as追加文本内容实例
摘要:最常见的读写操作import rewith open('/Users/Mr.Long/Desktop/data.txt', 'w') as f: f.write('hello world')就这样就完... 阅读全文
posted @ 2018-07-22 11:31 蔡军帅 阅读(1503) 评论(0) 推荐(0) 编辑
Python文件操作,with open as追加文本内容实例
摘要:最常见的读写操作 就这样就完成了文件的写操错(此处用with的格式,可以节省很多不必要的麻烦) 读操作同理,只是做一下微小的变化处理而已 一些正则表达式的关键词 w:以写方式打开, w:以写方式打开, a:以追加模式打开 (从 EOF 开始, 必要时创建新文件) a:以追加模式打开 (从 EOF 开 阅读全文
posted @ 2018-07-22 11:31 蔡军帅 阅读(519) 评论(0) 推荐(0) 编辑
Python中的Bunch模式
摘要:引用: 当树这样的数据结构被原型化(或者乃至于被定型)时,它往往会时一个非常有用而灵活的类型,允许我们在其构造器中设置任何属性。在这些情况下,我们会需要用到一种叫做“Bunch”的设计模式。... 阅读全文
posted @ 2018-07-22 11:22 蔡军帅 阅读(725) 评论(0) 推荐(0) 编辑
Python中的Bunch模式
摘要:引用: 当树这样的数据结构被原型化(或者乃至于被定型)时,它往往会时一个非常有用而灵活的类型,允许我们在其构造器中设置任何属性。在这些情况下,我们会需要用到一种叫做“Bunch”的设计模式。 由于这个类直接继承dict类,所以我们可以自然而然地获得dict类地大量功能,比如对键/值的遍历,或者简单查 阅读全文
posted @ 2018-07-22 11:22 蔡军帅 阅读(445) 评论(0) 推荐(0) 编辑
python文本挖掘模版
摘要:import xlrdimport jiebaimport sys import importlibimport os #python内置的包,用于进行文件目录操作,我们将会用到os.listd... 阅读全文
posted @ 2018-07-22 10:21 蔡军帅 阅读(190) 评论(0) 推荐(0) 编辑
python文本挖掘模版
摘要:import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文
posted @ 2018-07-22 10:21 蔡军帅 阅读(1807) 评论(0) 推荐(0) 编辑
使用Apriori算法和FP-growth算法进行关联分析
摘要:目录1. 关联分析2. Apriori原理3. 使用Apriori算法来发现频繁集4. 使用FP-growth算法来高效发现频繁项集5. 示例:从新闻网站点击流中挖掘新闻报道扩展阅读系列文章:《机器学习实... 阅读全文
posted @ 2018-07-16 11:46 蔡军帅 阅读(266) 评论(0) 推荐(0) 编辑
使用Apriori算法和FP-growth算法进行关联分析
摘要:目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP-growth算法来高效发现频繁项集 5. 示例:从新闻网站点击流中挖掘新闻报道 扩展阅读 目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP 阅读全文
posted @ 2018-07-16 11:46 蔡军帅 阅读(548) 评论(0) 推荐(0) 编辑
带你搞懂朴素贝叶斯分类算法
摘要:带你搞懂朴素贝叶斯分类算法 带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇... 阅读全文
posted @ 2018-07-16 11:41 蔡军帅 阅读(177) 评论(0) 推荐(0) 编辑
带你搞懂朴素贝叶斯分类算法
摘要:带你搞懂朴素贝叶斯分类算法 带你搞懂朴素贝叶斯分类算 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。 1 阅读全文
posted @ 2018-07-16 11:41 蔡军帅 阅读(7890) 评论(0) 推荐(1) 编辑
[Machine Learning & Algorithm] 随机森林(Random Forest)
摘要:http://www.cnblogs.com/maybe2030/p/4585705.html阅读目录1 什么是随机森林?2 随机森林的特点3 随机森林的相关基础知识4 随机森林的生成5 袋外错误率(oo... 阅读全文
posted @ 2018-07-16 11:17 蔡军帅 阅读(216) 评论(0) 推荐(0) 编辑
[Machine Learning & Algorithm] 随机森林(Random Forest)
摘要:http://www.cnblogs.com/maybe2030/p/4585705.html 阅读目录 1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Python 阅读全文
posted @ 2018-07-16 11:17 蔡军帅 阅读(482) 评论(0) 推荐(0) 编辑
随机森林入门攻略(内含R、Python代码)
摘要:简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中,随机森林一... 阅读全文
posted @ 2018-07-16 11:06 蔡军帅 阅读(255) 评论(0) 推荐(0) 编辑
随机森林入门攻略(内含R、Python代码)
摘要:简介 近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中,随机森林一次又一次地展示出令人难以置信的强大,而与此同时它又是如此的方便实用。 需要大家注意的是,在上文 阅读全文
posted @ 2018-07-16 11:06 蔡军帅 阅读(9450) 评论(0) 推荐(0) 编辑
python多标签分类模版
摘要:1 from sklearn.multioutput import MultiOutputClassifier 2 from sklearn.ensemble import RandomForestClassifier 3 from sklearn.ensemble import ExtraTreesClassifier 4 import numpy as np 5 from... 阅读全文
posted @ 2018-07-15 22:40 蔡军帅 阅读(4414) 评论(0) 推荐(0) 编辑
Win10 TensorFlow(gpu)安装详解
摘要:Win10 TensorFlow(gpu)安装详解写在前面:TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数... 阅读全文
posted @ 2018-07-06 13:18 蔡军帅 阅读(170) 评论(0) 推荐(0) 编辑
Win10 TensorFlow(gpu)安装详解
摘要:Win10 TensorFlow(gpu)安装详解 写在前面:TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从图象的一端流动到另一端 阅读全文
posted @ 2018-07-06 13:18 蔡军帅 阅读(6516) 评论(0) 推荐(0) 编辑
PAT甲级 1002 A+B for Polynomials (25)(25 分)
摘要:1002 A+B for Polynomials (25)(25 分)This time, you are supposed to find A+B where A and B are two polynomia... 阅读全文
posted @ 2018-07-05 19:47 蔡军帅 阅读(78) 评论(0) 推荐(0) 编辑
PAT甲级 1002 A+B for Polynomials (25)(25 分)
摘要:This time, you are supposed to find A+B where A and B are two polynomials. Input Each input file contains one test case. Each case occupies 2 lines, a 阅读全文
posted @ 2018-07-05 19:47 蔡军帅 阅读(293) 评论(0) 推荐(0) 编辑
二叉搜索树的操作集(30 分)
摘要:6-12 二叉搜索树的操作集(30 分)本题要求实现给定二叉搜索树的5种常用操作。函数接口定义:BinTree Insert( BinTree BST, ElementType X );BinTree D... 阅读全文
posted @ 2018-07-03 00:20 蔡军帅 阅读(149) 评论(0) 推荐(0) 编辑
二叉搜索树的操作集(30 分)
摘要:本题要求实现给定二叉搜索树的5种常用操作。 函数接口定义: BinTree Insert( BinTree BST, ElementType X ); BinTree Delete( BinTree BST, ElementType X ); Position Find( BinTree BST, 阅读全文
posted @ 2018-07-03 00:20 蔡军帅 阅读(361) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示