Now is best !

2013年12月3日

学习TF-IDF

摘要: 一、自动提取关键词 思路1:利用词频term frequency(TF) 的,是等词大量出现,无实际用处,因此可以必须过滤掉,构建停用词表stopwords。 对于文章中的某些常见词,与主题无关,例如中国。显然不应该作为关键词。 思路2:衡量某些词是否为高频词。如果某个词比较少见,但是在这个文章中出现频次较高, 那么很可能这个词反映了这篇文章的主题,因此我们可以拿来作为关键词。统计学上, 利用逆文档频率(Inverse Document Frequency:IDF)作为一个词的权重,用来衡量 这个词的重要性。 将TF与IDF相乘,就得到了我们一个词的TF-IDF值。某个词对文档... 阅读全文

posted @ 2013-12-03 23:37 fang0703 阅读(344) 评论(0) 推荐(0)

2013年12月2日

vim 常用命令

摘要: cw: 替换从光标所在位置后到一个结尾的字符^:到本行第一个字符不是blank的位置。u: undo: redoZZ: 保存并退出,不需要加冒号N 重复某个命令N次100idesu [ESC] ---> 插入100次desu2dd删除两行3p 粘贴三次光标移动:w,e 单词的开始和结束(字母、数字、下划线组成的单词)W,E 由blank分隔符构成的单词%: 匹配括号移动*和#: 匹配光标当前所在的单词,*是下一个,#是上一个eg. 0y$ ---> 从本行开始处拷贝到本行结束gU变大写gu变小写vim的超能力:t): 到)前的第一个字符f):找到下一个为)的字符处T和F功能相同,方 阅读全文

posted @ 2013-12-02 10:27 fang0703 阅读(228) 评论(0) 推荐(0)

vim 多文件编辑

摘要: 参考: usr_07.txt1. 假设需要编辑多个文件1.txt, 2.txt 3.txt第一种切换方式::next, :previous, :wnext, :wprevious:next表示切换到下一个文件编辑,如果没有保存,vim会给出提示。:wnext 相当于 :write 和 :next两个操作:args可以显示正在编辑的多个文件第二种用Ctrl + ^ 在两个文件之间快速切换假设你正在编辑2.txt, 敲入Ctrl+^可以回到1.txt,再次敲入Ctrl+^回到2.txt2. 几个有用的标记`“回到上次你离开文件的位置`.回到上次你最后一次修改文件时的位置利用m做标记,在当前位置敲入 阅读全文

posted @ 2013-12-02 10:23 fang0703 阅读(250) 评论(0) 推荐(0)

2013年11月29日

回溯法

摘要: 一、回溯法算法框架回溯法是一种枚举状态空间中所有可能状态的系统方法,它是一个一般性的算法框架,应用时须具体问题具体分析。在回溯法的每一步,我们从一个给定的部分解a=(a_1, a_2, ... , a_k)开始,尝试着在最后添加元素来扩展这个部分解。扩展之后,我们必须测试他是否为一个完整的解——如果是的话,需要输出这个解、更新解的计数器或者其他任何你想做的事。如果仍不完整,我们必须检查这个部分是否有可能扩展成完整解。如果有可能,递归下去;如果没有可能,从a中删除新加入的最后一个元素,然后尝试该位置上的其他可能性。下面是代码,使用了一个全局的finished标志来允许提前终止回溯过程。bool 阅读全文

posted @ 2013-11-29 23:34 fang0703 阅读(347) 评论(0) 推荐(0)

word2vec中k-means学习笔记

摘要: 一、k-means算法算法描述输入:簇的数目k;包含n个对象的数据集D。输出:k个簇的集合。方法:从D中任意选择k个对象作为初始簇中心;repeat;根据簇中对象的均值,将每个对象指派到最相似的簇;更新簇均值,即计算每个簇中对象的均值;计算准则函数;until准则函数不在发生变化二、Machine Learning(Ng)算法笔记算法主要思想:1)首先根据你要聚类的个数(假设为k),选择k个中心u,可以挑选k个样本作为中心。2)根据挑选出的k个中心,将每个样本(一共m个)贴上特定的标签。3)根据新贴的标签,更新样本的中心。三、word2vec中k-means实现 1 int clusterCo 阅读全文

posted @ 2013-11-29 22:37 fang0703 阅读(1594) 评论(0) 推荐(0)

2013年11月28日

linux ssh使用

摘要: SSH 远程登入服务器ssh username@192.168.0.1将 文件/文件夹 从linux服务器拷至本地(scp)scp -r username@192.168.0.1:/home/username/remotefile.txt .将 文件/文件夹 从本地拷至服务器(scp)scp -r localfile.txt username@192.168.0.1:/home/username/将 文件/文件夹 从服务器拷至本地(rsync)rsync -v -u -a --delete --rsh=ssh --stats username@192.168.0.1:/home/usernam 阅读全文

posted @ 2013-11-28 19:05 fang0703 阅读(296) 评论(0) 推荐(0)

2013年11月9日

Ubuntu 12.04 学习

摘要: 1. Wired not managed解决办法:1)修改NetworkManager文件sudo vim /etc/NetworkManager/NetworkManager.conf将managed=false 修改为 managed=true2) 重新启动NetworkManagersudo service network-manager restart2. 安装goagent下载最新的goagent:https://code.google.com/p/goagent/申请Google app engine 并创建appid -->修改local/proxy.ini 中的appid 阅读全文

posted @ 2013-11-09 10:58 fang0703 阅读(193) 评论(0) 推荐(0)

2013年10月23日

HDOJ 1058

摘要: 动态规划题,所有的humble number表示为 n = (2^i)*(3^j)*(5^k)*(7^l)。需要注意的是,i,j,k,l也只能是humble number,因此只能从已产生的humble number数组中选取。 1 #include 2 long long int a[5843]; 3 long long int t1,t2,t3,t4; 4 5 long long int minimum(int a1, int a2, int a3, int a4) 6 { 7 long long int ret = a1; 8 if (a2 <= ret) { 9 ... 阅读全文

posted @ 2013-10-23 23:03 fang0703 阅读(265) 评论(0) 推荐(0)

2013年10月21日

HDOJ 1009

摘要: 贪心法,每次都尽可能的多买性价比高的物品。 1 #include 2 #include 3 4 using namespace std; 5 struct Room { 6 int food; 7 int javabean; 8 }; 9 10 bool cmp(struct Room r1, struct Room r2)11 {12 double d1 = (double)(r1.javabean)/(double)(r1.food);13 double d2 = (double)(r2.javabean)/(double)(r2.food);14 retur... 阅读全文

posted @ 2013-10-21 14:34 fang0703 阅读(186) 评论(0) 推荐(0)

2013年10月19日

HDOJ 1003

摘要: 动态规划题,转移方程:C[i]=max{C[i-1]+A[i], A[i]} i=1,2,...,n C[0] = 0OPT(A) = max{C[i]}, i=1,2,...,n。最大的整数可以通过先将-1转成无符号整数,然后逻辑右移得到。需要注意几组特殊的数据:0 0 -1 0; -1 -2 -3; 1 2 3 -7 1 2 3。 1 #include 2 3 #define MAX_INT ((unsigned long)(-1)>> 1) 4 #define MIN_INT (MAX_INT+1) 5 6 int a[100000]; //store the number 阅读全文

posted @ 2013-10-19 14:14 fang0703 阅读(213) 评论(0) 推荐(0)

导航