上一页 1 2 3 4 5 6 7 8 ··· 13 下一页
摘要: 首先定义一个tf.train.Saver类: 其中,max_to_keep参数设定只保存最后一个参数,默认值是5,即保存最后5个模型,如果设置成0,训练过程中的所有模型都会被保存。 模型训练好以后,保存模型: 其中,sess是Session,ckpt_dir + "/nn_model.ckpt"是保 阅读全文
posted @ 2018-07-31 14:17 MSTK 阅读(395) 评论(0) 推荐(0) 编辑
摘要: Python可以实现多线程,但是因为Global Interpreter Lock (GIL),Python的多线程只能使用一个CPU内核,即一个时间只有一个线程在运行,多线程只是不同线程之间的切换,对多核CPU来说,就是巨大的浪费。如4核CPU,实际上只利用了一个核,CPU利用率只有25%。要充分 阅读全文
posted @ 2018-06-30 18:13 MSTK 阅读(565) 评论(0) 推荐(0) 编辑
摘要: 遗传算法(Genetic Algorithms, GA)是一种随机优化算法,用于解决结构复杂的优化问题。遗传算法模仿自然界中生物的进化过程,即适者生存,不适者淘汰的过程。其过程如下: (1) 随机生成一些个体(Individual),构成一个种群(Population),对每一个解进行评估,获得它的 阅读全文
posted @ 2018-05-27 12:26 MSTK 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 众所周知,Python和Java一样是基于虚拟机的语言,并不是像C/C++那样将程序代码编译成机器语言再运行,而是解释一行执行一行,速度比较慢。使用Numba库的JIT技术编译以后,可以明显提高程序的运行速度。 首先,使用PyCharm安装Numba库,在Project Interpreter界面可 阅读全文
posted @ 2018-04-24 21:00 MSTK 阅读(11380) 评论(1) 推荐(1) 编辑
摘要: Taylor formula(泰勒级数)用一个函数在某一点的连续导数之和来表示这个函数。如果函数在在点x=x0处有n阶导数,则f(x)可以按以下式子展开: 其目的在于用多项式函数逼近函数。如果x0=0,就是Maclaurin formula(麦克劳林公式): n的值越大,越逼近f(x),下图是f(x 阅读全文
posted @ 2018-04-20 21:40 MSTK 阅读(6176) 评论(0) 推荐(0) 编辑
摘要: 首先定义一个compare函数: 然后调用该函数就可以对List中的元素排序: 要求ListA中的元素有value这个属性才行,当然也可以把value换成ListA中的元素的其他共有属性也可以。感觉和Java差不多。 阅读全文
posted @ 2018-03-31 22:38 MSTK 阅读(5566) 评论(0) 推荐(0) 编辑
摘要: 当数据维数比较大时,就需要进行降维,特征选择是降维的一种主要方式,又包括3种方法:Filter、Wrapper和Enbedding。 1. Filter 过滤器方法,这种方法首先选定特征,再来进行学习。根据每一个属性的一些指标(如方差等),来确定这个属性的重要程度,然后对所有属性按照重要程度排序,从 阅读全文
posted @ 2018-02-23 21:09 MSTK 阅读(4927) 评论(0) 推荐(0) 编辑
摘要: SVMs(Surport Vector Machines)是用来解决两分类问题的,直接用SVMs实现多分类是不行的,只能使用下面这些间接的方法: (1)1-v-r,即对于每一个分类,训练一个该分类和其他分类的分类器,如对于类k,k是一类,所有其他的是另一类,这样就需要训练k个分类器。对未知样本分类时 阅读全文
posted @ 2018-02-20 09:35 MSTK 阅读(4460) 评论(0) 推荐(0) 编辑
摘要: 1. 打开文件 打开文件a.txt,后面的w表示写文件,r表示读取文件,并且返回一个文件对象。 2. 读取文件 表示读取文件中的一行。 3. 写入文件 其中line是一个字符串。 阅读全文
posted @ 2018-01-31 22:45 MSTK 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 1. 安装mysql-python 运行下面的命令: 安装以后: 如果没有出错,就表明安装成功。 2. 连接MySQL 其中localhost是服务器名,root是用户名,1是密码,fs是数据库名称,前提是MySQL数据库设置了相应的用户名和密码。 连接成功以后,通过 获取游标。 3. 查询数据 c 阅读全文
posted @ 2018-01-19 20:53 MSTK 阅读(444) 评论(0) 推荐(0) 编辑
摘要: 在一台机器上连接另一台机器的MySQL服务器时,出现了下面的错误: 这是对方机器没有关闭防火墙造成的,关闭对方机器防火墙以后就正常了。 阅读全文
posted @ 2018-01-18 22:04 MSTK 阅读(625) 评论(0) 推荐(0) 编辑
摘要: 首先,下载文件navicat120_mysql_cs_x64.tar.gz,然后用命令 解压。解压以后,进入解压目录,运行start_navicat,就可以运行了。 运行以后,可能出现乱码,这是因为默认的是英文,只识别UTF8的英文编码。用gedit打开文件start_navicat,把 改成 然后 阅读全文
posted @ 2018-01-18 21:37 MSTK 阅读(3860) 评论(0) 推荐(0) 编辑
摘要: Batch Size:批尺寸。机器学习中参数更新的方法有三种: (1)Batch Gradient Descent,批梯度下降,遍历全部数据集计算一次损失函数,进行一次参数更新,这样得到的方向能够更加准确的指向极值的方向,但是计算开销大,速度慢; (2)Stochastic Gradient Des 阅读全文
posted @ 2018-01-06 16:05 MSTK 阅读(14411) 评论(0) 推荐(0) 编辑
摘要: Python使用的(Garbage Collection, GC)机制是引用计数(Reference Count),其原理是为每一个内存对象进行引用计数,因此当有大量的对象新建或删除时,必须要进行大量修改引用计数的操作,影响了程序的性能。为避免这种情况的发生,可以在大量的对象新建或删除之前,把GC禁 阅读全文
posted @ 2017-12-30 17:46 MSTK 阅读(2487) 评论(0) 推荐(0) 编辑
摘要: 最近用TensorFlow实现遗传算法(Genetic Algorithms),发现迭代速度越来越慢,用time.time()观察以后,发现每次迭代都要比上一次慢0.5秒左右,但是每次迭代的计算量是差不多的。研究后发现,这是因为每次迭代都在计算图(Graph)里面增加了新的节点,节点越来越多,导致M 阅读全文
posted @ 2017-12-30 17:21 MSTK 阅读(1354) 评论(0) 推荐(0) 编辑
摘要: 首先,SVM和LR(Logistic Regression)都是分类算法。SVM通常有4个核函数,其中一个是线性核,当使用线性核时,SVM就是Linear SVM,其实就是一个线性分类器,而LR也是一个线性分类器,这是两者的共同之处。 不同之处在于,第一,LR只要求计算出一个决策面,把样本点分为两类 阅读全文
posted @ 2017-12-19 14:52 MSTK 阅读(1607) 评论(0) 推荐(0) 编辑
摘要: 1. 拉格朗日乘子(Lagrange Multiplier)法 假设函数z=f(x,y),求该函数的最小值,如果没有约束条件,则可以表示为minf(x,y),要求出minf(x,y)很简单,根据Fermat定理,分别对x和y求导数并让其等于0,如果是凸函数,则求出来的点就是函数取得最小值的点,该点的 阅读全文
posted @ 2017-11-16 20:30 MSTK 阅读(538) 评论(0) 推荐(0) 编辑
摘要: Python进行KMeans聚类是比较简单的,首先需要import numpy,从sklearn.cluster中import KMeans模块: 然后读取txt文件,获取相应的数据并转换成numpy array: 设置类的数量,并聚类: 完整代码: 运行结果: 阅读全文
posted @ 2017-10-30 17:57 MSTK 阅读(1290) 评论(1) 推荐(0) 编辑
摘要: 下面的String: 由于空格数量不一致,有的多,有的少,这时就需要使用正则表达式了,首先引入re模块: 定义一个正则表达式并编译成Pattern对象: 然后用Pattern对象Split: 阅读全文
posted @ 2017-10-30 17:44 MSTK 阅读(14117) 评论(1) 推荐(0) 编辑
摘要: 用Python读取txt文件时,发现读出来的是乱码: 用GEdit看了一下要读取的文件,发现编码用的是UTF-16,于是改成UTF-8从新保存: 然后就正常了: 阅读全文
posted @ 2017-10-30 17:32 MSTK 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 开机后发现CentOS 7不能进入图形界面,进入终端模式后运行startx命令也报错,不知道什么原因,后来运行了yum upgrade命令,升级以后就可以进入图形界面了,同时也升级了。 阅读全文
posted @ 2017-10-08 14:45 MSTK 阅读(2637) 评论(0) 推荐(0) 编辑
摘要: 1. CUDA Toolkit的安装 到https://developer.nvidia.com/cuda-gpus查询GPU支持的CUDA版本: 到https://developer.nvidia.com/cuda-downloads,根据操作系统选择下载相应的CUDA Toolkit版本,下载的 阅读全文
posted @ 2017-10-04 15:29 MSTK 阅读(3396) 评论(0) 推荐(1) 编辑
摘要: 1. 到http://www.geforce.cn/drivers,根据显卡的型号,选择下载相应的驱动程序,一般是.run文件; 2. 运行下载的.run文件,会提示X Server正在运行,不能安装,Ctrl + Alt + F2切换到控制台,以root用户登录后init 3,再运行这个文件,一般 阅读全文
posted @ 2017-09-18 14:22 MSTK 阅读(1717) 评论(0) 推荐(0) 编辑
摘要: 已经有Windows 7,准备再安装一个CentOS 7。 1. 划分磁盘空间 从磁盘上划分安装CentOS 7的安装空间。如果有多个硬盘的话,一定要在主硬盘上划分2G的空间(其实1G就够了)作为boot。这是因为开机时BIOS读取的是主硬盘的MBR,如果boot也在从硬盘,GRUB修改的是从硬盘的 阅读全文
posted @ 2017-09-18 13:48 MSTK 阅读(1065) 评论(0) 推荐(0) 编辑
摘要: 选取了10个文档,其中4个来自于一篇论文,3篇来自于一篇新闻,3篇来自于另一篇新闻。 首先在pom文件中加入mysql-connector-java: main函数: 运行结果: 阅读全文
posted @ 2017-08-13 15:05 MSTK 阅读(3795) 评论(0) 推荐(0) 编辑
摘要: 从另一台机器上复制过来的项目,由于两台机器的库目录不一致,导致了stdio.h等很多文件都打不开: 解决的办法是从新设置包含目录。选择项目-->%项目名称%属性-->VC++目录,设置包含目录为C:\Program Files %28x86%29\Windows Kits\10\Include\10 阅读全文
posted @ 2017-07-30 20:51 MSTK 阅读(22014) 评论(1) 推荐(0) 编辑
摘要: 1. 神经网络基础知识 1.1 神经元 神经网络(Neural Net)是由大量的处理单元相互连接形成的网络。神经元是神经网络的最小单元,神经网络由若干个神经元组成。一个神经元的结构如下: 上面的神经元x1,x2,x3和1是输入,hw,b(x)是输出。 其中f(x)是激活函数,常用的激活函数有sig 阅读全文
posted @ 2017-07-27 17:32 MSTK 阅读(6159) 评论(0) 推荐(0) 编辑
摘要: 协同过滤(Collaborative Filtering,CF)算法是一种常用的推荐算法,它的思想就是找出相似的用户或产品,向用户推荐相似的物品,或者把物品推荐给相似的用户。怎样评价用户对商品的偏好?可以有很多方法,如用户对商品的打分、购买、页面停留时间、保存、转发等等。得到了用户对商品的偏好,就可 阅读全文
posted @ 2017-07-21 19:09 MSTK 阅读(1916) 评论(1) 推荐(0) 编辑
摘要: 1. Alternating Least Square ALS(Alternating Least Square),交替最小二乘法。在机器学习中,特指使用最小二乘法的一种协同推荐算法。如下图所示,u表示用户,v表示商品,用户给商品打分,但是并不是每一个用户都会给每一种商品打分。比如用户u6就没有给商 阅读全文
posted @ 2017-07-19 23:09 MSTK 阅读(18957) 评论(4) 推荐(2) 编辑
摘要: 关联规则挖掘最典型的例子是购物篮分析,通过分析可以知道哪些商品经常被一起购买,从而可以改进商品货架的布局。 1. 基本概念 首先,介绍一些基本概念。 (1) 关联规则:用于表示数据内隐含的关联性,一般用X表示先决条件,Y表示关联结果。 (2) 支持度(Support):所有项集中{X,Y}出现的可能 阅读全文
posted @ 2017-07-16 20:09 MSTK 阅读(10772) 评论(1) 推荐(2) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 13 下一页