GJS
少年,奋起吧。
摘要: 需要安装 python,numpy,tensorflow,运行代码即可。 tensorflow很好装,用pip安装即可。 可以参照http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.htm安装。数据集:mnis 阅读全文
posted @ 2016-07-25 19:24 GJS Blog 阅读(2418) 评论(0) 推荐(0) 编辑
摘要: 1.冒泡排序: (1)比较相邻的元素。如果第一个比第二个大,就交换他们两个。 (2)外面再套个循环就行。 算法复杂度:O(N2) 不罗嗦,上代码: 2. 选择排序 (1)每次从剩下无序中选择最小的元素,进行交换 算法复杂度:O(N2) 不罗嗦,上代码: 3.插入排序: (1)基本操作就是将一个数据插 阅读全文
posted @ 2016-03-07 15:18 GJS Blog 阅读(601) 评论(0) 推荐(0) 编辑
摘要: 1.所需要软件下载: (1)libsvm(http://www.csie.ntu.edu.tw/~cjlin/libsvm/) (2)python (3)gnuplot 画图软件(ftp://ftp.gnuplot.info/pub/gnuplot/)这里只考虑windows的环境: 1、 下载li... 阅读全文
posted @ 2015-05-06 10:29 GJS Blog 阅读(24871) 评论(2) 推荐(2) 编辑
摘要: 集成学习:是目前机器学习的一大热门方向,所谓集成学习简单理解就是指采用多个分类器对数据集进行预测,从而提高整体分类器的泛化能力。 我们在前面介绍了。所谓的机器学习就是通过某种学习方法在假设空间中找到一个足够好的函数h逼近f,f是现实数据的分布函数模型,这个近似的函数就是分类器。 我们以分类问... 阅读全文
posted @ 2014-10-18 20:51 GJS Blog 阅读(18830) 评论(0) 推荐(0) 编辑
摘要: 1.最大似然估计(MLE): 什么是最大似然估计? 问题:给定一组观察数据还有一个参数待定的模型,如何来估计这个未知参数呢? 观察数据(x1,y1)......(xn,yn) 待定模型参数为θ,模型为f(x;θ)。这时候可以借助观察数据来估计这个θ。这就是最大似然函数估计。 举个例子: ... 阅读全文
posted @ 2014-09-11 17:24 GJS Blog 阅读(2195) 评论(0) 推荐(0) 编辑
摘要: JAVA 并发编程 最初计算机是单任务的,然后发展到多任务,接着出现多线程并行,同时计算机也从单cpu进入到多cpu。如下图: 多任务:其实就是利用操作系统时间片轮转使用的原理。操作系统通过将cpu的执行时间分割成多个时间片,为每个任务分配时间片,因为cpu处理速度很快,这样就用户看来好... 阅读全文
posted @ 2014-09-01 21:04 GJS Blog 阅读(18098) 评论(1) 推荐(4) 编辑
摘要: HDFS Hadoop的核心就是HDFS与MapReduce。那么HDFS又是基于GFS的设计理念搞出来的。 HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文... 阅读全文
posted @ 2014-08-18 11:06 GJS Blog 阅读(2394) 评论(0) 推荐(1) 编辑
摘要: 决策树(decision tree) 决策树:是一种基本的分类和回归方法。它是基于实例特征对实例进行分类的过程,我们可以认为决策树就是很多if-then的规则集合。 优点:1)训练生成的模型可读性强,我们可以很直观的看出生成模型的构成已经工作方式,因为模型就是由数据属性和类别构成一棵树。 ... 阅读全文
posted @ 2014-08-12 19:57 GJS Blog 阅读(2068) 评论(4) 推荐(0) 编辑
摘要: 首先来说明一下bootstraps:可以把它认为是一种有放回的抽样方法。bagging:boostraps aggregating(汇总)boosting:Adaboot (Adaptive Boosting)提升方法提升(boosting):在分类问题中,通过改变训练样本的权重,学习多个分类器,并... 阅读全文
posted @ 2014-08-11 20:37 GJS Blog 阅读(1441) 评论(0) 推荐(1) 编辑
摘要: 模型发展 NNLM(2003) FastText (2016),基于wordemdding(CBOW、skip-gram): 模型简单简单、快速,直接把句子对应的词向量相加求和平均作为input,用基于霍夫曼树的分层softmaxt。可以作为一个baseline版本模型 TextCNN (2014) 阅读全文
posted @ 2019-07-18 11:45 GJS Blog 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 1. 何为损失函数: 在机器学习里面,基本上所有的算法都是在对一个目标函数进行最大化或者最小化的一个过程,那么我们常常把这个最小化的函数称为损失函数,一般采用梯度下降法求解这个损失函数的最小值所对应的参数。可以认为,损失函数为我们的模型优化提供了方向。 2. 损失函数类型: 2.1 平方损失L2 ( 阅读全文
posted @ 2018-07-31 12:08 GJS Blog 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 运行全节点的用途: 1.挖矿 2.钱包 运行全节点,可以做关于btc的任何事情,例如创建钱包地址、管理钱包地址、发送交易、查询全网的交易信息等等 选个节点钱包:bitcoind 1.配置文件: ~/.bitcoin/bitcoin.conf 文件配置 testnet=1 # 测试网络 (同步快,17 阅读全文
posted @ 2018-06-22 10:40 GJS Blog 阅读(7069) 评论(0) 推荐(0) 编辑
摘要: 目前,教育领域通过引入人工智能的技术,使得在线的教学系统成为了智能教学系统(ITS),ITS不同与以往的MOOC形式的课程。ITS能够个性化的为学生制定有效的 学习路径,通过根据学生的答题情况追踪学生当前的一个知识点掌握状况,从而可以做到因材施教。 在智能教学系统中,当前有使用以下三种模型对学生的知 阅读全文
posted @ 2017-07-03 17:43 GJS Blog 阅读(10564) 评论(2) 推荐(0) 编辑
摘要: from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.feature_selection import SelectKBest, chi2 from sklearn.feature_e... 阅读全文
posted @ 2016-07-21 13:37 GJS Blog 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 论文:Spark: Cluster Computing with Working Sets 1.背景: 解决一些hadoop无法胜任的工作,倒不是hadoop不能做,就是hadoop做这些事情效果不好,时间长。因为hadoop 每个map reduce都会把中间内容数据写到disk里面,之后再从di 阅读全文
posted @ 2016-07-05 18:58 GJS Blog 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 删除gcc-4.6的软连接文件/usr/bin/gcc。(只是删除软连接) 命令:sudo rm /usr/bin/gcc 然后建一个软连接,指向gcc-4.4。 命令:sudo ln -s /usr/bin/gcc-4.4 /usr/bin/gcc 阅读全文
posted @ 2016-06-11 21:38 GJS Blog 阅读(1312) 评论(0) 推荐(0) 编辑
摘要: 1.找到两个数组中的相同元素 数组A 数组B 方法1:对A中的数组进行排序,采取同样的排序方法对B中的数组进行排序      1)从A,B中各自取出a,b进行比较      2)如果a>b,那么从B中取出下一个数据b进行比较  3)如果a<b,那么从A中取出下一个数据a进行比较      4)如果a 阅读全文
posted @ 2016-03-15 16:22 GJS Blog 阅读(4341) 评论(0) 推荐(0) 编辑