上一页 1 2 3 4 5 6 7 8 ··· 14 下一页
摘要: 0. octave是什么? 用于数值计算和绘图的软件,和matlab一样精于矩阵计算,适用语法上基本无异于matlab(它的安装包相对小巧)。 阅读全文
posted @ 2012-09-19 19:18 liyuxia713 阅读(1264) 评论(0) 推荐(0) 编辑
摘要: 特征归一化 & 特征选择 阅读全文
posted @ 2012-09-19 13:19 liyuxia713 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是:https://class.coursera.org/ml-2012-002/lecture/index如上一节:线性回归问题介绍 中所讲, 解决线性回归问题,其实就是找使成本函数最小值的点。成本函数:J(a,b)=1/2m * sum[(a+bx)-y]2,多特征情况下成本函数为:J(a) = 1/2m *sum( (Xa-y).^2), 其中X是m*n矩阵,a是n*1特征权重向量,y是n*1向量,m为样本个数,n为特征个数,X(i,j)为第i个样本中第j个特征的值。1. 正规化方程组解法: 要取得J(a)的最小值,只需要... 阅读全文
posted @ 2012-09-18 16:53 liyuxia713 阅读(1261) 评论(0) 推荐(0) 编辑
摘要: 这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是:https://class.coursera.org/ml-2012-002/lecture/index如上一节介绍,线性回归是有监督学习的机器学习类型,是要预测出连续值,而非离散值。解决线性回归问题,一般需要一个成本函数,目标就是使得成本函数最低。线性回归问题的成本函数,形如J(a,b)=1/2m * sum[(a+bx)-y]^2,其中m是训练样本个数,a+bx是预测的线性函数,(x,y)是训练样本特征值和结果值。问题1: 为什么成本函数用预测距离的2阶幂函数,而不是绝对值、1阶幂函数、4阶幂函数等?答:不用奇数阶的原因是,他不能区分 阅读全文
posted @ 2012-09-11 22:40 liyuxia713 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是:https://class.coursera.org/ml-2012-002/lecture/index1. 什么是机器学习? 它能做什么?学过算法的同学知道,我们可以写一个程序,让机器执行我们预设的步骤,去求解如最短路径问题等有特定结果的问题。但是在一些情况下,尤其是涉及概率问题的有不确定结果的问题,单纯的算法又是不足以解决实际问题的,如股票价格预测,性格分类等。那这些问题如何解决呢? 这里就是机器学习的战场了。机器学习(Machine Learning,简称ML),可以理解为不用你去写具体执行步骤,而让机器有能力去学习出结果的课题。在 阅读全文
posted @ 2012-09-11 22:15 liyuxia713 阅读(581) 评论(0) 推荐(0) 编辑
摘要: crontab的作用是,你可以指定任何任务在你指定的时间,以你指定的周期执行。1. 首先你可以看下,你所在机器上,是否已经有这种任务在执行, 执行下面的语句crontab -l如果没有输出,就是你所在的机器还没人用crontab任务。2. 如何添加这种周期性任务?(此时假定你了解crontab命令的格式,或者从哪里可以拷贝一个,后面会讲)简单来讲,就是写一个文件,然后让其生效。可以执行下面的过程,这个就是启动了在每天的12:00输出一遍当时的crontab任务到crontab.work这个文件。#创建你的crontab文件vi mycrontab#写入00 12 * * * cd /home. 阅读全文
posted @ 2012-09-07 15:22 liyuxia713 阅读(512) 评论(0) 推荐(0) 编辑
摘要: 追查一个项目模块的性能问题(处理时间增加),最终追查到是由于在一个循环中增加了一条读语句。终于对积少成多对性能的影响有了一次亲身体会。另一个体会就是追查问题时一定要考虑编译器优化的影响。对MAX_SIZE=1000000测试:场景1:简单的一个语句 for(size_t i=0; i < MAX_SIZE; ++i){}需要执行2.768ms, 加上-O3优化后执行0.79ms;场景2:循环内增加一个操作,(不要是sum+=i; 之类的,因为i已经存到寄存器,所以此部分不会增加多少计算时间)for(size_t i=0; i < MAX_SIZE; ++i){ sum += i.. 阅读全文
posted @ 2012-09-05 09:59 liyuxia713 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 出现这种异常的情形是: 一个python实现,将结果print到标准输出, 用python tool.py > out 这种方式运行正常, 但用python tool.py | head 这种管道方式执行时在print那行语句上出现标题所示的“IOError: [Errno 32] Broken pipe”错误原因是:python将这种管道截取的操作当成是一种输出异常,导致异常退出。解决方式,用try ... except Exception捕获异常即可。 阅读全文
posted @ 2012-07-13 17:31 liyuxia713 阅读(4651) 评论(0) 推荐(1) 编辑
摘要: 对于shell,通过date命令可以获取到当前时间,还可以设定特殊格式,看help你可以看到下面两个好用的参数:%s seconds since '00:00:00 1970-01-01 UTC' (a GNU extension)%N nanoseconds (000000000..999999999)这里%s表示当前时间的秒数,而%N表示当前时间的纳秒部分,即1秒以下的那部分,那么通过%s%N结合使用,我们就可以拿到纳秒级别的数据了。#!/bin/shfunction getTiming(){ start=$1 end=$2 start_s=`echo $... 阅读全文
posted @ 2012-07-05 15:47 liyuxia713 阅读(15362) 评论(0) 推荐(0) 编辑
摘要: 1. 确立一个可操作的目标(可观察、具体是在的),而不是那种模糊而抽象的目标。 不是:“我要停止拖延。” 而是:“我要在九点之前打扫和整理我的车库。”2. 设定一个务实的目标。不要异想天开,而要从小事做起。不要过于理想化,而要选择一个能接受的程度最低的目标。 不是:“我绝不再拖延!” 而是:“我会每天花一个小时的时间学习数学。”3. 将你的目标分解成短小具体的迷你目标。每一个迷你目标都要比大目标容易达成,小目标可以累积成大目标。 不是:“我打算要写那份报告。” 而是:“今晚我将花半个小时设计表格。明天我将话另外半个小时把数据填进去,再接下来一天,我将根据那些数据花一个小时将报告写出... 阅读全文
posted @ 2012-06-22 18:46 liyuxia713 阅读(414) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 14 下一页