12 2013 档案

vim 常用命令
摘要:http://litaotao.blog.51cto.com/6224470/1251299%!xxd 转16进制,左边将显示16进制代码,右侧是你实际写的代码:%!xxd -rset nu 显示行号shift a 行尾追加 help setU R 撤销 与 反撤销 阅读全文

posted @ 2013-12-31 16:56 雨渐渐 阅读(158) 评论(0) 推荐(0) 编辑

Html Meta 标签详解
摘要:http://www.dreamdu.com/xhtml/tag_meta/ 阅读全文

posted @ 2013-12-31 16:09 雨渐渐 阅读(128) 评论(0) 推荐(0) 编辑

基于行块分布函数的正文抽取
摘要:如果无法FQ获取最新版:百度网盘下载:(各种语言版本及算法说明)链接:http://pan.baidu.com/s/1c0ImY7e 密码:tcr6基于行块分布函数的正文抽取算法思路:1、预处理:剔除网页HTML标签,去掉所有的空白符(\n,\r,\t等);2、依据"\n"分行,若某文字行的上下存在... 阅读全文

posted @ 2013-12-31 11:40 雨渐渐 阅读(1190) 评论(0) 推荐(0) 编辑

机器学习公开课~~~~mooc
摘要:https://class.coursera.org/ntumlone-001/class/index 阅读全文

posted @ 2013-12-17 16:42 雨渐渐 阅读(150) 评论(0) 推荐(0) 编辑

快速排序
摘要:参考源:http://www.cnblogs.com/morewindows/archive/2011/08/13/2137415.html__author__ = 'root'arr_in = [72, 6, 57, 88, 60, 42, 83, 73, 48, 85]def sort(start, end): if end - start = x: j -= 1 if i void quick_sort(int s[], int l, int r){ if(l = x) j --; ... 阅读全文

posted @ 2013-12-05 16:36 雨渐渐 阅读(181) 评论(0) 推荐(0) 编辑

mapreduce (三) MapReduce实现倒排索引(二)
摘要:hadoop apihttp://hadoop.apache.org/docs/r1.0.4/api/org/apache/hadoop/mapreduce/Reducer.html改变一下需求:要求“文档词频列表”是经过排序的,即 出现次数高的再前思路:代码:package proj;import... 阅读全文

posted @ 2013-12-05 14:10 雨渐渐 阅读(595) 评论(4) 推荐(0) 编辑

temp gbk2utf8
摘要:__author__ = 'root'# -*- coding: utf-8 -*-ps = '/data/poitestdata/行政地名.csv'pt = '/data/poitestdata/utf8_行政地名.csv'perr = '/data/poitestdata/err_行政地名.csv'f = open(ps)f_ok = open(pt, 'w')f_err = open(perr, 'w')count_err = 0count_ok = 0while True: line = f 阅读全文

posted @ 2013-12-03 09:55 雨渐渐 阅读(178) 评论(0) 推荐(0) 编辑

导航