摘要:
转:http://www.datasoldier.net/post/standard.html#6751916-tsina-1-56599-e0502dfbeb854be61cee4792d7b07761数据标准化处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标即处于同一数量级,适合进行综合对比评价。极差法极差法是对原始数据的线性变换,首先计算指标值得最小值、最大值,计算极差,通过极差法将指标值映射到[0-1]之间。公式为 阅读全文
摘要:
国内期刊一般要求公式采用Mathtype编辑,无奈还需要把latex格式的转成Matheype格式下面罗列一下常见的一些问题1.MathType怎么把多行公式的编号放在最后一行 选中公式编号,去字体选项中找位置项目,修改位置项的值,你想放在哪里就可放在哪里2. Maathtype中如何实现黑斜体style->define-->advanced-->vectorandmatrix的check项中 把bold和italic都打勾。 然后就可以用快捷键ctrl+shift+b来对选中的字母变成黑斜体. 如果你使用LaTeX,可以用bm宏包,然后 \bm{A}就可以产生A的黑斜体。3 阅读全文
摘要:
转:http://blog.sina.com.cn/s/blog_496f70740100dbso.html摘要是简洁、具体的摘要要反映论文的实质性内容,展示论文内容足够的信息,体现论文的创新性,展现论文的重要梗概,一般由具体研究的对象、方法、结果、结论四要素组成。对象——是论文研究、研制、调查等所涉及的具体的主题范围,体现论文的研究内容、要解决的主要问题,是问题的提出,研究方向的确立与目标的定位。方法——是论文对研究对象进行研究的过程中所运用的原理、理论、条件、材料、工艺、结构、手段、程序,是完成研究对象的必要手段。结果——是作者运用研究方法对研究对象进行实验、研究所得到的结果、效果、数据, 阅读全文
摘要:
转:http://blog.sciencenet.cn/blog-729961-590995.html[摘要]“文摘应该以第三人称书写”,长期、广泛地被认可-显露式地误解为:“文摘应该以第三人称语气书写”。这种“误解”的实质,就是混淆了语法人称与作者的人称语气(人称身份;即:篇章人称)。学术著作(学术论文、文摘、专著中的章节),均是自述性写作;均是作者署名者所写,这个道理谁人不知、那个读者不晓;其作者的人称身份(人称语气)总是第一人称的;这是客观存在的。作者署名(随同作者单位署名)肯定是最主要的、最强有力的与最明显的第一人称的标志。第一人称代词及其限定词(物主代词)的使用,仅仅是承前代表作者署 阅读全文
摘要:
screen进入screen模式Ctrl+ a+c在当前screen下建立新的窗口exit退出当前窗口,如果它是此screen的唯一窗口时,此screen也将完全退出。Ctrl+ a + d 暂时断开screen会话screen -ls查看有哪些screen。screen -r id 打开编号为id的screen窗口。Ctrl+a+ w 显示所有窗口列表Ctrl+ a+n 切换到下一个窗口Ctrl+ a+p 切换到前一个窗口(与Ctrl+ a n相对)ssh中如果发生了突然断线 那么你重新登陆后 screen -ls 会发现 有screen的状态是处于(Attached)状态 此刻我们使用 s 阅读全文
摘要:
假设检验初步这篇文章讲的相当不错,在这里总结一下P:是原假设,也是准备拒绝的假设当我们假设P成立的时候,可以从数据中观测到事件Q然后判断Q是否为非常极端的(pvalue非常小<置信水平)如果在正常情况下,Q的发生是非常极端(本来不该发生,却发了)我们就可以因为Q的发生而拒绝P(原假设)从而备择假设就是成立的举例说明P:硬币是均匀的Q:在1 00次投掷中,得到90次正面,1 0次反面在假设P成立的条件下,却观测到了事件Q。在正常情况下,如果P成立,事件Q是小概率事件(是极端事件)但是Q却实发生了,因此,我们以比较大的概率拒绝P,也就是P是不成立的脚注:p值,是用来判断Q是否为极端事件 阅读全文
摘要:
转:http://blog.csdn.net/chjjunking/article/details/5933105让我们从头说起,首先AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识,而不同时期流行的度量则反映了人们认识事物的深度的变 化。近年来,随着machine learning的相关技术从实验室走向实际应 阅读全文
摘要:
转:http://blog.sina.com.cn/s/blog_5e16f1770100gzud.html如图:演示代码:\documentclass{article}\setlength\textwidth{245.0pt}\usepackage{CJK}\usepackage{indentfirst}\usepackage{amsmath}\begin{CJK*}{GBK}{song}\begin{document}方法一:$$ f(x)=\left\{\begin{aligned}x & = & \cos(t) \\y & = & \sin(t) \\z 阅读全文
摘要:
转:http://blog.csdn.net/jlei_apple/article/details/8168856这两天在看关于boosting算法时,看到一篇不错的文章讲bootstrap, jackknife, bagging, boosting, random forest 都有介绍,以下是搜索得到的原文,没找到博客作者的地址,在这里致谢作者的研究。一并列出一些找到的介绍boosting算法的资源:(1)视频讲义,介绍boosting算法,主要介绍AdaBoosing http://videolectures.net/mlss05us_schapire_b/ (2) 在这个网站的资源项. 阅读全文
摘要:
转:http://www.resyschina.com/2011/04/one-class-collaborative-filtering.htmlYangQiang教授指导的这篇ICDM2008的文章我2年前就拜读过,但当初对上面的方法不是特别感冒,所以也就没有记得特别清楚。最 近,KDD Cup的第二个track的问题和这篇Paper的研究问题很像,同时我在做KDD Cup时也设计了一个算法,感觉效果非常好,我准备把他称作基于采样的binarySVD算法。然后我准备研究一下这个算法是不是已经有人提出来了,因为 我隐约记得是看过类似的方法。结果我一查,发现果然是,标题里的那篇论文就是用的类似 阅读全文