摘要: 最近一直在研究用户付费时该把收益分配给哪个广告渠道的问题。按照公司以前的分法,很容易导致搜索这样的强势渠道表现更为强劲,而带来用户和流量的小渠道则表现得更为差劲,因为用户大多数被这些渠道吸引过来,但却在强势渠道上付费。 在搜索资料的过程中,发现谷歌分析的高级版具有这方面的功能。在google上搜索到了一个GA的Playbook,就是关于归因建模分析(谷歌中文上貌似... 阅读全文
posted @ 2012-09-20 14:14 Core Hua 阅读(873) 评论(0) 推荐(0) 编辑
摘要: 由于工作中需要直接从MySQL后台读取数据,所以安装了PHPnow,装的过程中提示Apache安装失败,80端口被占用。 在cmd中输入netstat –ano命令,发现80端口被一个PID为4的服务所占用,打开任务管理器,发现PID为4的进程为系统进程,其描述信息为NT Kernel & System,在服务里面又找不到PID为4的服务,所以没法停掉服务。 这种情况基... 阅读全文
posted @ 2012-08-28 19:25 Core Hua 阅读(2157) 评论(0) 推荐(0) 编辑
摘要: 其实Windows操作系统有一个功能,是按住Alt键再加上右边数字小键盘中的数字,会输出相应的字符。这个方法的原理是输入的数字其实是 一串ASCII码,出来的是对应于该ASCII码的字符,如果数字超过255,则出来的是对应国标区位码的字符(有汉字)。 当然,让我们记住这么多的码是不现实的,但是若能记住一些常用的特殊字符的话,一定能给共走带来方便。 下面是... 阅读全文
posted @ 2012-08-24 10:21 Core Hua 阅读(4569) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘不仅涉及到数据建模分析,还涉及到数据的抓取,预处理以及后期的汇报,因此是一个综合要求比较高的活。为了更好的胜任这个工作,近期开始学习一些Office方面的技巧,并将之记录下来,以备以后回顾,也希望能给其他人带来便利。 Excel本身就有很强的数据处理功能,但遗憾的是在以前的学习和工作中几乎用不到它,这几天算是刚刚入门吧。这里很多的技巧都是在网上找的,只不过我自己都验证过了... 阅读全文
posted @ 2012-08-23 16:06 Core Hua 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 今天看朱世武老师的《SAS编程技术教程》一书的时候,遇到一个问题,就是在SAS中打开一张表之后,右击Edit Mode,弹出了下面的警告框: 并且表格不能切换到编辑模式。经过在谷歌中搜索一番,发现有一个英文的网页里面提到了这个问题,链接如下:http://support.sas.com/kb/14/592.html问题产生的原因:当sas软件本身的界面是中文、英文或者其它语言的时候,对应的编码方式是不一样的,或者可以理解为,在中文模式下是用gb2312来处理数据表,但是在英文模式下式用其它的编码方式来处理数据表。那么,如果一个在英文界面下生成的数据表,放到中文界面下来修改的话,肯定编码是不一. 阅读全文
posted @ 2012-08-13 20:51 Core Hua 阅读(1009) 评论(0) 推荐(0) 编辑
摘要: K-均值法也叫C-均值法,它是一种广泛使用的聚类方法。它以K为输入参数,把n个对象的集合分为k个簇,使得簇内的相似度尽可能高,而簇间的相似度尽可能的低。 K均值基于误差平方和准则。随机选择k个对象,每个对象代表一个簇的初始均值。对于下的每个对象,根据其与各个簇的均值的距离,将它指派到最相似的簇(距离最小)。然后计算每个簇的新的均值。此过程不断重复,直至准则函数收敛。误差平方和定义... 阅读全文
posted @ 2012-07-25 23:48 Core Hua 阅读(2509) 评论(0) 推荐(0) 编辑
摘要: C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。 C4.5由J.Ross Quinlan在ID3的基础上提出的。ID3算法用来构造决策树。决策树是一... 阅读全文
posted @ 2012-07-25 22:47 Core Hua 阅读(40499) 评论(3) 推荐(2) 编辑
摘要: 第二篇主要是讲述了SVM中最简单的情况,也就是线性可分的两类问题。在前面给出的公式中,对Lagrange函数的产生过程及接下来的推导还是有一些疑问,后来查了一些资料,终于释放掉心中的疑云,现记录如下。 有疑问的地方是: 前文说的最优分类面问题转化成如下的约束优化问题,即在条件 的约束下,求函数 的最小值。这是没问题的,但是紧接着作者通过定... 阅读全文
posted @ 2012-07-25 01:18 Core Hua 阅读(747) 评论(0) 推荐(0) 编辑
摘要: 最近看了张学工老师的《关于统计学习理论与支持向量机》和Vapnik的《Support Vector Networks》两篇文章。张学工老师是国内接触SVM比较早的学者,他的这篇文章算是支持向量机的一个综述;而Vapnik先生是SVM的发明者,SVM大牛中的大牛。他的这篇文章据说是支持向量机的第一篇论文。 我看文献的习惯是先找一篇国内比较好的综述进行阅读,然后从这篇文章中去找相应的... 阅读全文
posted @ 2012-07-24 23:05 Core Hua 阅读(1154) 评论(0) 推荐(0) 编辑
摘要: 上学的时候,在《模式识别》课程里面接触到支持向量机,但说实话,那时候对它一知半解。虽然当时完成了一个大作业,效果也不错,但终究对它有一种似是而非的感觉。为了不让这种感觉再继续下去,这段时间好好研究一下。接下来会用几篇日志记载这段时间的收获。 要学习支持向量机,先从我教材《模式识别》(边肇祺,张学工版)出发。这次看书的时候对书上297页的一个地方,也就是最优分类面: 的分类间隔是 具体怎么推导出来有点不明白,书上的推导过程是放在4.1节即“线性判别函数”那一节。现在来看看具体的推导过程: 给出两类情况下判别函数为线性的一般表达式: (1) 式中x是d维特征向量,... 阅读全文
posted @ 2012-07-24 12:40 Core Hua 阅读(1012) 评论(0) 推荐(0) 编辑