编程浪子Yiutto

2016年6月2日

Python科学计算（二）windows下开发环境搭建（当用pip安装出现Unable to find vcvarsall.bat）

摘要：用于科学计算Python语言真的是amazing！方法一：直接安装集成好的软件刚开始使用numpy、scipy这些模块的时候，图个方便直接使用了一个叫做Enthought的软件。Enthought是一家位于美国得克萨斯州首府奥斯汀的软件公司，主要使用Python从事科学计算工具的开发。Entho 阅读全文

posted @ 2016-06-02 20:39 编程浪子Yiutto 阅读(1309) 评论(0) 推荐(0) 编辑

2016年5月26日

贝叶斯学习1

摘要：一、什么是贝叶斯推断贝叶斯推断（Bayesian inference）是一种统计学方法，用来估计统计量的某种性质。它是贝叶斯定理（Bayes' theorem）的应用。英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年发表的一篇论文中，首先提出了这个定理。贝叶斯推断与其他统计学推阅读全文

posted @ 2016-05-26 15:11 编程浪子Yiutto 阅读(2871) 评论(0) 推荐(0) 编辑

2016年4月27日

Python下科学计算包numpy和SciPy的安装

摘要： Python下大多数工具包的安装都很简单，只需要执行 “python setup.py install”命令即可。然而，由于SciPy和numpy这两个科学计算包的依赖关系较多，安装过程较为复杂。网上教程较为混乱，而且照着做基本都不能用。在仔细研读各个包里的README和INSTALL之后，终于安装阅读全文

posted @ 2016-04-27 14:16 编程浪子Yiutto 阅读(2129) 评论(2) 推荐(0) 编辑

2016年4月14日

从网上或者哪里拷贝下来的代码前面总有编号，如何去掉（原创）

摘要：从网上或者哪里拷贝下来的代码前面总有编号，如何去掉呢，网上有说用程序的太麻烦，于是，我找到了下面两种方法，share 一下~ 1.使用正则表达式：在editorplus（notepad++）里按ctrl+h，弹出框里勾选上“正则表达式（regular expression）”，然后第一个框里写 ^[ 阅读全文

posted @ 2016-04-14 21:15 编程浪子Yiutto 阅读(2260) 评论(0) 推荐(0) 编辑

2016年4月13日

python解析xml之lxml

摘要：虽然python解析xml的库很多，但是，由于lxml在底层是用C语言实现的，所以lxml在速度上有明显优势。除了速度上的优势，lxml在使用方面，易用性也非常好。这里将以下面的xml数据为例，介绍lxml的简单使用。 1、将xml解析为树结构，并得到该树的根。为了将xml解析为树结构，并得到该树阅读全文

posted @ 2016-04-13 14:25 编程浪子Yiutto 阅读(13604) 评论(0) 推荐(0) 编辑

2016年3月10日

TF/IDF（term frequency/inverse document frequency)

摘要： TF/IDF（term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。一. TF/IDF描述单个term与特定document的相关性TF(Term Frequency): 表示一个term与某个document的相关性。公式为: 阅读全文

posted @ 2016-03-10 14:35 编程浪子Yiutto 阅读(912) 评论(0) 推荐(0) 编辑

TF-IDF与余弦相似性的应用（三）：自动摘要

摘要：有时候，很简单的数学方法，就可以完成很复杂的任务。这个系列的前两部分就是很好的例子。仅仅依靠统计词频，就能找出关键词和相似文章。虽然它们算不上效果最好的方法，但肯定是最简便易行的方法。今天，依然继续这个主题。讨论如何通过词频，对文章进行自动摘要（Automatic summarization）。阅读全文

posted @ 2016-03-10 11:08 编程浪子Yiutto 阅读(398) 评论(0) 推荐(0) 编辑

TF-IDF与余弦相似性的应用（二）：找出相似文章

摘要：上一次，我用TF-IDF算法自动提取关键词。今天，我们再来研究另一个相关的问题。有些时候，除了找到关键词，我们还希望找到与原文章相似的其他文章。比如，"Google新闻"在主新闻下方，还提供多条相似的新闻。为了找出相似的文章，需要用到"余弦相似性"（cosine similiarity）。下面，阅读全文

posted @ 2016-03-10 11:07 编程浪子Yiutto 阅读(289) 评论(0) 推荐(0) 编辑

TF-IDF与余弦相似性的应用（一）：自动提取关键词

摘要：这个标题看上去好像很复杂，其实我要谈的是一个很简单的问题。有一篇很长的文章，我要用计算机提取它的关键词（Automatic Keyphrase extraction），完全不加以人工干预，请问怎样才能正确做到？这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域，但是出乎意料的是，有一阅读全文

posted @ 2016-03-10 11:04 编程浪子Yiutto 阅读(304) 评论(0) 推荐(0) 编辑

2016年3月8日

R语言绘图002-页面布局

摘要： par()、layout()、split.screen()函数 1. par()函数的参数详解函数par()可以用来设置或者获取图形参数，par()本身（括号中不写任何参数）返回当前的图形参数设置（一个list）；若要设置图形参数，则可用par(tag = value)的形式，其中tag的详细说明参见下面的列，value就是参数值，例如： par(mar = c(4, 4, 1, 0.5)... 阅读全文

posted @ 2016-03-08 20:25 编程浪子Yiutto 阅读(2883) 评论(0) 推荐(0) 编辑

编程浪子-Yiutto

月落乌啼霜满天，江枫渔火对愁眠

公告