[置顶] 近期工作计划/按进度更新

只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2010-08-07 21:46 amojry 阅读(126) 评论(0) 推荐(0) 编辑

Distributed Sentence Similarity Base on Word Mover's Distance

摘要: Algorithm:Refrence from one ICML15 paper: Word Mover's Distance.1. First use Google's word2vec tool to get distributed word representing aka. word vec... 阅读全文
posted @ 2015-08-12 22:44 amojry 阅读(566) 评论(0) 推荐(0) 编辑

Java 简繁转换 ZHConverter

摘要: Sampleimport com.spreada.utils.chinese.ZHConverter;public class Test{ public static void main(String[] args){ ZHConverter converter = ZHConverter.get... 阅读全文
posted @ 2015-08-12 22:32 amojry 阅读(3982) 评论(0) 推荐(0) 编辑

python setup.py install 失败

摘要: 由于curl证书太老,所以无法找到一些对应的版本。如下更新证书即可:curl http://curl.haxx.se/ca/cacert.pem > /etc/pki/tls/certs/ca-bundle.crt/ca-bundle.crt 阅读全文
posted @ 2015-08-11 11:15 amojry 阅读(3057) 评论(0) 推荐(0) 编辑

Python xlsx 读取

摘要: 代码示例#!/usr/bin/env pythonimport xlrd, sys, re, osworkbook = xlrd.open_workbook( sys.argv[1] )for booksheet in workbook.sheets(): for row in xra... 阅读全文
posted @ 2015-08-06 19:50 amojry 阅读(9974) 评论(0) 推荐(0) 编辑

Java ArrayList Sort

摘要: Collections.sort(hits_list, new Comparator(){ @Override public int compare(ScoreDoc arg0, ScoreDoc arg1) {... 阅读全文
posted @ 2015-07-28 23:23 amojry 阅读(1849) 评论(0) 推荐(0) 编辑

java console ( mac osx ) 命令行编码

摘要: 方法vi ~/.bash_profile#添加新行, UTF-8表示你平台的编码方式#例如你是GBK、GB18030的#替换成你平台console可现实字符编码即可export JAVA_TOOL_OPTIONS=-Dfile.encoding=UTF-8. ~/.bash_profile现象处于工... 阅读全文
posted @ 2015-07-19 10:15 amojry 阅读(741) 评论(0) 推荐(0) 编辑

Lucene Query Term Weighting

摘要: 方法 1 public static Query TermWeighting(Query tquery,Mapterm2weight){ 2 BooleanQuery nquery = new BooleanQuery(); 3 Set terms = new... 阅读全文
posted @ 2015-07-16 22:53 amojry 阅读(812) 评论(0) 推荐(0) 编辑

Fast Intro To Java Programming (2)

摘要: Java局部变量局部变量声明在方法、构造方法或者语句块中;局部变量在方法、构造方法、或者语句块被执行的时候创建,当它们执行完成后,变量将会被销毁;访问修饰符不能用于局部变量;局部变量只在声明它的方法、构造方法或者语句块中可见;局部变量是在栈上分配的。局部变量没有默认值,所以局部变量量被声明后,必须经... 阅读全文
posted @ 2015-05-22 12:22 amojry 阅读(272) 评论(0) 推荐(0) 编辑

Fast Intro To Java Programming (1)

摘要: 基本语法编写Java程序时,应注意以下几点:大小写敏感:Java是大小写敏感的,这就意味着标识符Hello与hello是不同的。类名:对于所有的类来说,类名的首字母应该大写。如果类名由若干单词组成,那么每个单词的首字母应该大写,例如MyFirstJavaClass 。方法名:所有的方法名都应该以小写... 阅读全文
posted @ 2015-05-22 11:39 amojry 阅读(177) 评论(0) 推荐(0) 编辑

随感 20150512

摘要: 无论做哪种形式的奋斗或准备我们的目标是让自己的思维肌肉更加发达使得我们在看待这个世界时可以更加清晰以及有高度 阅读全文
posted @ 2015-05-12 09:28 amojry 阅读(151) 评论(0) 推荐(0) 编辑

循环数组中找查找某个数值

摘要: 1、 由于是有序数组,log(n)的时间查找最小值的index1.1 一定要注意当m、r、l三个位置相同值时,无法区分左右了,所以需要在l到r区间遍历找到最小元素。2、 看最小值index的左右两侧,是否查找值落在 [l,i] 与 [i,r] 上,在对应区间上进行二分查找 1 #include 2 ... 阅读全文
posted @ 2015-05-12 09:19 amojry 阅读(1547) 评论(0) 推荐(0) 编辑

数字内组合得到下一个比该数大的数

摘要: # 随意输入一个数字,用该数字内的数字组合出下一个比该数大的新数。# 例如输入14321 下一个是 21134# 这类问题,除了能给出穷举可能序列,并且找出下一个大的数字外# 可以通过,人工的罗列下几个可能得数字找规律。# 例如这一题的规则是:从后至前的找第一对逆序位置,交换逆序位置的元素,并且将前... 阅读全文
posted @ 2015-05-05 15:59 amojry 阅读(654) 评论(0) 推荐(0) 编辑

SVM直观原理,以及LIBSVM的应用

摘要: SVM的原理SVM的主要思想可以概括为两点:(1) 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而 使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;(2) 它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是 阅读全文
posted @ 2011-11-12 15:04 amojry 阅读(6384) 评论(0) 推荐(1) 编辑

规并排序 以及 在其基础上的逆序对

摘要: 写递归程序的时候,一定要注意其递归体的逻辑,另外假设子问题已经解决。辅助函数只要解决好当前层自问体就好了,不要思考太多层次的东西,当然特殊的递归需求会有考虑多层次的东西。merge(int l, int m, int r, int *a) {l -> mm+1->r 要合并求逆序对个数的时候,可以在规并的过程中来数逆序对数。L[]有序,R[]有序那么L[I] <= R[J]时候,不需要累计逆序对数否则L[I] > R[J]那么说明L[I] - > L[LEN_OF_LEFTPART] 都是与R[J]有逆序的关系。所以插入R[J]时候发现的逆序对数目是LEN_OF_ 阅读全文
posted @ 2011-10-18 13:34 amojry 阅读(481) 评论(0) 推荐(0) 编辑

操作符重载

摘要: 重写操作符的时候 const A& operator (符号)(参数){}如果第一个参数为常量的时候,例如CLASSA m = 1 + m;那么要定义友元类friend const A& operator(int i, A& m){};一般操作符的左边的那个为调用者本人,操作符右侧的类是参数作为加入单元运算的时候,左++ 和 右++为了区分需要用一个int型的参数加以区分。const A& operator ++ () { // 左,且要临时多加一个A类多想作为返回值,因为左++,当前的返回值不改变。}const A& operator ++(int){ 阅读全文
posted @ 2011-10-13 23:31 amojry 阅读(561) 评论(0) 推荐(0) 编辑