liyuxia713 - 博客园

2012年9月19日

【Stanford Machine Learning Open Course】5. Octave入门

摘要： 0. octave是什么？用于数值计算和绘图的软件，和matlab一样精于矩阵计算，适用语法上基本无异于matlab（它的安装包相对小巧）。阅读全文

posted @ 2012-09-19 19:18 liyuxia713 阅读(1270) 评论(0) 推荐(0) 编辑

【Stanford Machine Learning Open Course】4. 特征优化

摘要：特征归一化 & 特征选择阅读全文

posted @ 2012-09-19 13:19 liyuxia713 阅读(273) 评论(0) 推荐(0) 编辑

2012年9月18日

【Stanford Machine Learning Open Course】3. 线性回归问题两种解法：正规方程组解法 & 梯度下降法

摘要：这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是：https://class.coursera.org/ml-2012-002/lecture/index如上一节：线性回归问题介绍中所讲，解决线性回归问题，其实就是找使成本函数最小值的点。成本函数：J(a,b)=1/2m * sum[(a+bx)-y]2，多特征情况下成本函数为：J(a) = 1/2m *sum( (Xa-y).^2)，其中X是m*n矩阵，a是n*1特征权重向量，y是n*1向量，m为样本个数，n为特征个数，X(i,j)为第i个样本中第j个特征的值。1. 正规化方程组解法：要取得J(a)的最小值，只需要... 阅读全文

posted @ 2012-09-18 16:53 liyuxia713 阅读(1265) 评论(0) 推荐(0) 编辑

2012年9月11日

【Stanford Machine Learning Open Course】2. 线性回归问题介绍

摘要：这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是：https://class.coursera.org/ml-2012-002/lecture/index如上一节介绍，线性回归是有监督学习的机器学习类型，是要预测出连续值，而非离散值。解决线性回归问题，一般需要一个成本函数，目标就是使得成本函数最低。线性回归问题的成本函数，形如J(a,b)=1/2m * sum[(a+bx)-y]^2，其中m是训练样本个数，a+bx是预测的线性函数，(x,y)是训练样本特征值和结果值。问题1：为什么成本函数用预测距离的2阶幂函数，而不是绝对值、1阶幂函数、4阶幂函数等？答：不用奇数阶的原因是，他不能区分阅读全文

posted @ 2012-09-11 22:40 liyuxia713 阅读(386) 评论(0) 推荐(0) 编辑

【Stanford Machine Learning Open Course】1. 机器学习介绍

摘要：这里是斯坦福大学机器学习网络课程的学习笔记。课程地址是：https://class.coursera.org/ml-2012-002/lecture/index1. 什么是机器学习？它能做什么？学过算法的同学知道，我们可以写一个程序，让机器执行我们预设的步骤，去求解如最短路径问题等有特定结果的问题。但是在一些情况下，尤其是涉及概率问题的有不确定结果的问题，单纯的算法又是不足以解决实际问题的，如股票价格预测，性格分类等。那这些问题如何解决呢？这里就是机器学习的战场了。机器学习（Machine Learning，简称ML），可以理解为不用你去写具体执行步骤，而让机器有能力去学习出结果的课题。在阅读全文

posted @ 2012-09-11 22:15 liyuxia713 阅读(584) 评论(0) 推荐(0) 编辑

2012年9月7日

【linux】crontab周期性/定时启动任务

摘要： crontab的作用是，你可以指定任何任务在你指定的时间，以你指定的周期执行。1. 首先你可以看下，你所在机器上，是否已经有这种任务在执行, 执行下面的语句crontab -l如果没有输出，就是你所在的机器还没人用crontab任务。2. 如何添加这种周期性任务？（此时假定你了解crontab命令的格式，或者从哪里可以拷贝一个，后面会讲）简单来讲，就是写一个文件，然后让其生效。可以执行下面的过程，这个就是启动了在每天的12:00输出一遍当时的crontab任务到crontab.work这个文件。#创建你的crontab文件vi mycrontab#写入00 12 * * * cd /home. 阅读全文

posted @ 2012-09-07 15:22 liyuxia713 阅读(516) 评论(0) 推荐(0) 编辑

2012年9月5日

关注性能：循环的耗时及编译优化的影响

摘要：追查一个项目模块的性能问题（处理时间增加），最终追查到是由于在一个循环中增加了一条读语句。终于对积少成多对性能的影响有了一次亲身体会。另一个体会就是追查问题时一定要考虑编译器优化的影响。对MAX_SIZE=1000000测试：场景1：简单的一个语句 for(size_t i=0; i < MAX_SIZE; ++i){}需要执行2.768ms，加上-O3优化后执行0.79ms；场景2：循环内增加一个操作，（不要是sum+=i; 之类的，因为i已经存到寄存器，所以此部分不会增加多少计算时间）for(size_t i=0; i < MAX_SIZE; ++i){ sum += i.. 阅读全文

posted @ 2012-09-05 09:59 liyuxia713 阅读(210) 评论(0) 推荐(0) 编辑

2012年7月13日

【python】 IOError: [Errno 32] Broken pipe

摘要：出现这种异常的情形是：一个python实现，将结果print到标准输出，用python tool.py > out 这种方式运行正常，但用python tool.py | head 这种管道方式执行时在print那行语句上出现标题所示的“IOError: [Errno 32] Broken pipe”错误原因是：python将这种管道截取的操作当成是一种输出异常，导致异常退出。解决方式，用try ... except Exception捕获异常即可。阅读全文

posted @ 2012-07-13 17:31 liyuxia713 阅读(4666) 评论(0) 推荐(1) 编辑

2012年7月5日

【Linux】shell: 获取时间间隔到毫秒、微秒级别

摘要：对于shell，通过date命令可以获取到当前时间，还可以设定特殊格式，看help你可以看到下面两个好用的参数：%s seconds since '00:00:00 1970-01-01 UTC' (a GNU extension)%N nanoseconds (000000000..999999999)这里%s表示当前时间的秒数，而%N表示当前时间的纳秒部分，即1秒以下的那部分，那么通过%s%N结合使用，我们就可以拿到纳秒级别的数据了。#!/bin/shfunction getTiming(){ start=$1 end=$2 start_s=`echo $... 阅读全文

posted @ 2012-07-05 15:47 liyuxia713 阅读(15497) 评论(0) 推荐(0) 编辑

2012年6月22日

拖延处理技巧汇编--摘自《拖延心理学》

摘要： 1. 确立一个可操作的目标（可观察、具体是在的），而不是那种模糊而抽象的目标。不是：“我要停止拖延。” 而是：“我要在九点之前打扫和整理我的车库。”2. 设定一个务实的目标。不要异想天开，而要从小事做起。不要过于理想化，而要选择一个能接受的程度最低的目标。不是：“我绝不再拖延！” 而是：“我会每天花一个小时的时间学习数学。”3. 将你的目标分解成短小具体的迷你目标。每一个迷你目标都要比大目标容易达成，小目标可以累积成大目标。不是：“我打算要写那份报告。” 而是：“今晚我将花半个小时设计表格。明天我将话另外半个小时把数据填进去，再接下来一天，我将根据那些数据花一个小时将报告写出... 阅读全文

posted @ 2012-06-22 18:46 liyuxia713 阅读(419) 评论(0) 推荐(0) 编辑

liyuxia

认真生活着、蹒跚前行着

公告