dandingyy

2013年3月8日

摘要：一个很不错得截图工具～～KSnapshot是KDE集成桌面环境自带的截图工具，不过在GNOME集成桌面环境下也可以安装和使用它。我们可以通过新立得软件包管理器或使用apt-get命令来安装它。假设使用命令行方式来安装，打开一个GNOME终端窗口，在终端窗口中输入如下命令： sudo apt-get install ksnapshot 命令执行后，将在线下载并安装KSnapshot。安装完毕后，在菜单“应用程序”→“图像”下找到“KSnapshot”项，点击该项则运行KSnapshot程序(如图4)。 KSnapshot功能非常强大，提供的截图模式有全屏(Full Screen)、光... 阅读全文

posted @ 2013-03-08 21:03 dandingyy 阅读(729) 评论(0) 推荐(1) 编辑

ssh配置使用

摘要： 1.安装OpenSSH服务器一般用ps -e查看会发现只有ssh-agent进程. 使用sudo apt-get install ssh 安装ssh服务器，结束后使用ps -e | grep ssh会看到多了一个sshd进程，这就是ssh服务器进程 2.ssh配置 OpenSSH守护进程在Red Hat中使用/etc/ssh/sshd_config配置文件，一般使用其默认配置即可。启动OpenSSH服务，使用/sbin/service sshd start命令（一般在安装完成后sshd会自动启用，所以这步其实可以省略），然后使用ps -e看到多了一个sshd... 阅读全文

posted @ 2013-03-08 21:00 dandingyy 阅读(401) 评论(0) 推荐(0) 编辑

hadoop全局变量与数据传递

摘要：首先明确：1.Hadoop不支持全局变量，也不建议使用全局变量。我的理解是，这是因为hadoop具有map类和reducer类，并且不同的task一般执行的是不同的map或reduce。所以全局变量是无法传递的。（但是一般情况下，我们也许会需要一个对于所有map和reduce都能访问的全局变量），暂时我知道的解决方法如下：2.如果Mapper类和Reducer类都是主类的内部类，可以在主类中使用 private static string global = "global variable"; 但是这种方法不通用，因为Mapper类和Reducer类在概念上是与主类无关的阅读全文

posted @ 2013-03-08 20:55 dandingyy 阅读(5408) 评论(0) 推荐(0) 编辑

hadoop上的pageRank算法

摘要：简单的pageRank实现参考：http://wlh0706-163-com.iteye.com/blog/1397694较为复杂的PR值计算以及在hadoop上的实现：http://deathspeeder.is-programmer.com/posts/31349.htmlpageRank算法的基本思想是：网页的热门程度依赖指向它的网页的热门程度。也许google当初的PageRank网页排名有着很严密的数学逻辑推导，但在编程的时候实现这种数学推导困难很大，用的更多的是另外一个超级简单的数学公式，同样可以实现将网页排名的目的。PageRank原理分析举例来讲：假设每个网页都有一个自己的默认阅读全文

posted @ 2013-03-08 20:52 dandingyy 阅读(6495) 评论(1) 推荐(0) 编辑

MapReduce中文件的压缩和解压

摘要： 1.单个文件的压缩或解压import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStream;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io 阅读全文

posted @ 2013-03-08 20:36 dandingyy 阅读(495) 评论(0) 推荐(0) 编辑

hadoop文件合并

摘要：众所周知，Hadoop对处理单个大文件比处理多个小文件更有效率，另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。1，getmergehadoop有一个命令行工具getmerge，用于将一组HDFS上的文件复制到本地计算机以前进行合并参考：http://hadoop.apache.org/common/docs/r0.19.2/cn/hdfs_shell.html使用方法：hadoop fs -getmerge <src> <localdst> [addnl]接受一个源目录和一个目标文件作为输入，并且将源目录中所有的文件连接成本地目标文件。addnl是可阅读全文

posted @ 2013-03-08 20:33 dandingyy 阅读(21417) 评论(1) 推荐(0) 编辑

hadoop遇到的问题

摘要：装好hadoop，但是一直出现问题，总结如下：排错到现在，最大的感觉是，也许你的错误表象跟网上说的一样，但是解决方法会大有不同，只能说这种错误是同一问题（如namenode出错）导致，但是究竟是什么行为导致这个问题，每个人也许都不相同，所以重点是找到自己的操作时的错误所在.1.Too many fetch-failures错误问题介绍：http://blog.csdn.net/liangliyin/article/details/6455713网上的解决方案：1）Answer:（http://www.hadoopor.com/thread-71-1-1.html）出现这个问题主要是结点间的. 阅读全文

posted @ 2013-03-08 20:30 dandingyy 阅读(1631) 评论(1) 推荐(0) 编辑

hadoop二次排序

摘要：文章转自：http://blog.csdn.net/heyutao007/article/details/5890103趁这个时候，顺便把hadoop的用于比较的Writable, WritableComparable, Comprator等搞清楚。。1.二次排序概念：首先按照第一字段排序，然后再对第一字段相同的行按照第二字段排序，注意不能破坏第一次排序的结果。如：输入文件：20 21 50 51 50 52 50 53 50 54 60 51 60 53 60 52 60 56 60 57 70 58 60 61 70 5... 阅读全文

posted @ 2013-03-08 20:26 dandingyy 阅读(9409) 评论(1) 推荐(0) 编辑

eclipse中 unable to load native-hadoop library

摘要：解决参考：http://blog.csdn.net/hongweigg/article/details/7203749我的过程是：1。在run configuration中 Arguments/VM arguments加上如下语句：2.如果不行可以在properities/java build path中添加：library/add external folder, 选择/home/kqiao/hadoop-0.20.203.0/lib/native/Linux-i386-32 阅读全文

posted @ 2013-03-08 20:22 dandingyy 阅读(2630) 评论(0) 推荐(0) 编辑

使用FileSystem类操作HDFS文件

摘要：全部程序如下：import java.io.IOException;import java.net.URI;import java.net.URISyntaxException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apache.hadoop.fs.FSDataOutputStream;import org.apache.hadoop.fs.FileStatus;import org.apache.hadoop.fs.FileSys 阅读全文

posted @ 2013-03-08 20:20 dandingyy 阅读(6270) 评论(0) 推荐(0) 编辑

window.onload = function() { dp.SyntaxHighlighter.ClipboardSwf = 'https://files.cnblogs.com/dandingyy/clipboard.swf'; dp.SyntaxHighlighter.HighlightAll('code'); };

公告