摘要: 在我们的对2016年大数据行业的预测文章《2016年大数据将走下神坛拥抱生活 资本青睐创业机会多》里,我们曾经提到“在2016年,防止网站数据爬取将变成一种生意。”。今天我找到了来自”BSDR“的一篇文章,文章里主要介绍了常见的反爬虫应对方法,下面是正文。 常见的反爬虫 这几天在爬一个网站,网站做了 阅读全文
posted @ 2016-07-05 23:29 dy9776 阅读(1194) 评论(0) 推荐(0) 编辑
摘要: 2002年8月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4、0.5、0.6三个版本 2004年9月Oregon State University(俄勒冈州立大学)采用Nutch 2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务 阅读全文
posted @ 2016-07-05 18:01 dy9776 阅读(218) 评论(0) 推荐(0) 编辑
摘要: Apache Ivy是一个管理项目依赖的工具 它与Maven Apache Maven 构建管理和项目管理工具已经吸引了 Java 开发人员的注意。Maven 引入了 JAR 文件公共存储库的概念,可通过公开的 Web 服务器访问(称为 ibiblio)。Maven 的方法减少了 JAR 文件膨胀的 阅读全文
posted @ 2016-07-05 17:58 dy9776 阅读(2781) 评论(0) 推荐(0) 编辑
摘要: 转:http://www.linuxidc.com/Linux/2012-10/71557.htm 首先确实不得不说,网上有很多类似Ubuntu下安装JDK7的教程。不过大都是基于JDK6的bin文件。如果你现在去Oracle官网去看一下的话,会发现都变成.tar.gz的压缩文件了。 另外本文还顺带 阅读全文
posted @ 2016-07-05 11:09 dy9776 阅读(1202) 评论(0) 推荐(0) 编辑
摘要: ubuntu安装好之后,默认是不能用root用户登录桌面的,只能使用普通用户或者访客登录。怎样开启root用户登录桌面呢? 先用普通用户登录,然后切换到root用户,然后执行如下命令: 在打开的文件里添加一句: 这句的意思是在登录时允许用户自己输入用户名和密码。 然后给root用户设置登录密码,设置 阅读全文
posted @ 2016-07-05 10:15 dy9776 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 作为系统管理员,你可能经常会(在某个时候)需要查看系统中有哪些用户正在活动。有些时候,你甚至需要知道他(她)们正在做什么。本文为我们总结了4种查看系统用户信息(通过编号(ID))的方法。 1. 使用w命令查看登录用户正在使用的进程信息 w命令用于显示已经登录系统的用户的名称,以及他们正在做的事。该命 阅读全文
posted @ 2016-07-05 08:58 dy9776 阅读(139472) 评论(0) 推荐(3) 编辑
摘要: Linux下修改root密码方法 以root身份登陆,执行: 然后根据提示,输入新密码,再次输入新密码,系统会提示成功修改密码。 具体示例如下: Linux下添加新用户的命令 Linux下root密码找回方法 Linux的root享有至高无上的权力,一旦root密码忘记或者被盗,是一件非常头痛的事情 阅读全文
posted @ 2016-07-05 08:47 dy9776 阅读(94488) 评论(0) 推荐(0) 编辑
摘要: 为了能在自己笔记本电脑上兼容公司的用64位系统编译出来的MapReduce程序,我把自己原来32位的ubuntu虚拟机删除后,安装了目前最新的ubuntu-14.04.2-desktop-amd64.iso。 但问题出现了,我的Winscp和putty都连接不上我的ubuntu系统,经一番探索,总结 阅读全文
posted @ 2016-07-05 08:08 dy9776 阅读(6043) 评论(0) 推荐(0) 编辑