2014年10月26日
摘要: 锁:内置锁 (监视器锁): 每个java对象都可以做一个实现同步的锁,这些锁被成为内置锁. 获得锁的唯一途径就是进入有这个锁保护的代码块或方法重入锁: 由于内置锁是可重入的,因此如果某个线程试图获得一个以已经由他自己持有的锁, 那么这个请求就会成功.重入意味着获取锁的操作粒度是"线程",而不是"调用... 阅读全文
posted @ 2014-10-26 08:57 ahujack 阅读(217) 评论(0) 推荐(0) 编辑
  2014年9月16日
摘要: 利用hadoop streaming框架,帮助我们在map和reduce之间传递数据,通过stdin和stdout.http://wenku.baidu.com/link?url=R1vj6NWV5nv_aVI8P0G5SNzxOyaDsffGeOJrRT6iA9iYHry3w60hJ9CVAtS1... 阅读全文
posted @ 2014-09-16 18:13 ahujack 阅读(173) 评论(0) 推荐(0) 编辑
  2014年5月22日
摘要: 今年上半年,我在人人网实习了一段时间,期间得到了很多宝贵的数据,并做了一些还算有意义的事情,在这里和大家一块儿分享。感谢人人网提供的数据与工作环境,感谢赵继承博士、詹卫东老师的支持和建议。在这项工作中,我得到了很多与众人交流的机会,特别感谢 OpenParty 、 TEDxBeijing 提供的平台... 阅读全文
posted @ 2014-05-22 13:37 ahujack 阅读(266) 评论(0) 推荐(0) 编辑
  2013年10月14日
摘要: 输入一个已经按升序排序过的数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字。要求时间复杂度是O(n)。如果有多对数字的和等于输入的数字,输出任意一对即可。例如输入数组1、2、4、7、11、15和数字15。由于4+11=15,因此输出4和11。设和为 sum,数组为a分析:(1)遍历一遍数组,当前遍历到a[i]。由于生序排列,可以二分查询sum-a[i]是否在a中的复杂度为O(lgn),整个算法复杂度为O(nlgn),不合题意。(2)对于每一个数a[i],关键问题是查询sum-a[i]是否在a中。题目中升序排列这个条件还有一个性质, ... 阅读全文
posted @ 2013-10-14 11:16 ahujack 阅读(315) 评论(0) 推荐(0) 编辑
  2013年9月13日
摘要: 接到一个case让我确认一台虚拟机的网关。如果是147.128.17.1的话要改成147.128.17.129。网上的方法是如果分为两种:如果是动态IP的话,用route命令,看到的default 字段的gateway就是默认网关。如果是静态IP的话,vi /etc/sysconfig/network/ifcfg-eth0 添加GATEWAY=147.128.17.129用route命令看到的结果是147.128.17.1,于是我通过vi/etc/sysconfig/network/ifcfg-eth0 添加网关。然后用route -rn 看到默认网关还是147.128.17.1,而且trac 阅读全文
posted @ 2013-09-13 14:07 ahujack 阅读(220) 评论(0) 推荐(0) 编辑
  2013年9月5日
摘要: 今天下午有点时间,总结一下,昨天完成的任务。昨天早上收到一封邮件,提到三个任务,如下:Could you please help to start some services on server 10.170.81.139.1. tftp: tftp home: /tftpboot2. Samba: folders should be accessible: /local/sp210-310 and /tftpboot/sync/3. apache: we need to make the HTML files under /proj/mwn_auto/scm/ delivery_notes; 阅读全文
posted @ 2013-09-05 15:32 ahujack 阅读(393) 评论(0) 推荐(0) 编辑
  2013年8月29日
摘要: 2>&1使用一 相关知识1)默认地,标准的输入为键盘,但是也可以来自文件或管道(pipe |)。2)默认地,标准的输出为终端(terminal),但是也可以重定向到文件,管道或后引号(backquotes `)。3) 默认地,标准的错误输出到终端,但是也可以重定向到文件。4)标准的输入,输出和错误输出分别表示为STDIN,STDOUT,STDERR,也可以用0,1,2来表示。5)其实除了以上常用的3中文件描述符,还有3~9也可以作为文件描述符。3~9你可以认为是执行某个地方的文件描述符,常被用来作为临时的中间描述符。二 实例1)command 2>errfile : com 阅读全文
posted @ 2013-08-29 11:34 ahujack 阅读(206) 评论(0) 推荐(0) 编辑
  2013年8月28日
摘要: 在爱立信实习Linux管理员也有一个月了。最近老大让我修改一个rsync自动备份的脚本。提出两个需求:第一,把不需要的文件过滤掉。第二,report的格式要好看一点。改好的脚本如下,分享一下:#!/bin/bashset -x#Get hostnameHOSTNAME=`hostname`#Check autofs availablityls /net/150.236.72.6/vol/vol_ipos_etos17if [ $? = 0 ] ; then echo AUTOFS GOOD on "$HOSTNAME" > /tmp/fasdkl921jkl.`dat 阅读全文
posted @ 2013-08-28 09:45 ahujack 阅读(555) 评论(0) 推荐(0) 编辑
  2013年5月24日
摘要: 1.LDA算法思想及工作流程,包括讲讲其中细节,如何抽取主题模型2.PLSA算法思想3.贝叶斯分类器如何工作4.为什么贝叶斯计算要定义特征之间是相互独立的5.K-means算法的原理和时间复杂度,这个算法一般要运行多少次才收敛6.基于用户的协同过滤算法如何计算用户相似度,基于item的协同过滤算法如何计算item的相似度7.如何处理大数据量的相似度计算8.给出两个查询词,如何通过搜索引擎得到两个词的相似度,如果搜索引擎的搜索结果不可靠该用什么方法计算,不考虑语义。9.在微博博文里如何计算两篇博文的相关度10.C++中虚函数的实现机制,编译器都做了什么11.C++中inline和define的区 阅读全文
posted @ 2013-05-24 08:45 ahujack 阅读(525) 评论(1) 推荐(0) 编辑
摘要: LDA算法入门一.LDA算法概述:线性判别式分析(LinearDiscriminantAnalysis,LDA),也叫做Fisher线性判别(FisherLinearDiscriminant,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵 阅读全文
posted @ 2013-05-24 08:01 ahujack 阅读(189) 评论(0) 推荐(0) 编辑