猿人谷 - 博客园

2013年3月4日

摘要：之前做聊天室时，由于在聊天室中提供了新闻阅读的功能，写了一个从网页中抓取信息（如最新的头条新闻，新闻的来源，标题，内容等）的类，本文将介绍如何使用这个类来抓取网页中需要的信息。本文将以抓取博客园首页的博客标题和链接为例：上图显示的是博客园首页的DOM树，显然只需提取出class为post_item的div，再重中提取出class为titlelnk的a标志即可。这样的功能可以通过以下函数来实现：/// /// 在文本html的文本查找标志名为tagName,并且属性attrName的值为attrValue的所有标志/// 例如：FindTagByAttr(html, "div" 阅读全文

posted @ 2013-03-04 20:41 猿人谷阅读(1084) 评论(0) 推荐(0) 编辑

2013年3月1日

相对路径和绝对路径的区别

摘要：以后慢慢启用个人博客：http://yuanrengu.com/ 在HTML里只要涉及文件的地方(如超级链接、图片等)就会涉及绝对路径与相对路径的概念。 1.绝对路径绝对路径是指文件在硬盘上真正存在的路径。例如“bg.jpg”这个图片是存放在硬盘的“E:\book\网页布局代码\第2章”目录下，那阅读全文

posted @ 2013-03-01 16:26 猿人谷阅读(124232) 评论(1) 推荐(28) 编辑

HTML中的相对路径与绝对路径

摘要： HTML初学者会经常遇到这样一个问题，如何正确引用一个文件。比如，怎样在一个HTML网页中引用另外一个HTML网页作为超链接(hyperlink)？怎样在一个网页中插入一张图片？......(相关教程：HTML超链接；HTML图片)如果你在引用文件时(如加入超链接，或者插入图片等)，使用了错误的文件路径，就会导致引用失效(无法浏览链接文件，或无法显示插入的图片等)。为了避免这些错误，正确地引用文件，我们需要学习一下HTML路径。HTML有2种路径的写法：相对路径和绝对路径。HTML相对路径(Relative Path)同一个目录的文件引用如果源文件和引用文件在同一个目录里，直接写引用文件名即可阅读全文

posted @ 2013-03-01 16:14 猿人谷阅读(6151) 评论(0) 推荐(5) 编辑

2013年1月24日

开发项目的简单流程（需求、数据库、编码）

摘要：很长时间没有更新博客了，心里一直想写点什么东西的，可是，回到住的地方的时候心就懒了，不爱动手，再加上这段时间比较忙，心情也比较复杂，所以一直没有更新博客。今天是星期天，仔细回想一下以前的工作，心里大致的想了一段时间，对我这段时间的工作算是做一个总结吧，因为，在周五的时候就是我们的需求有点小变化... 阅读全文

posted @ 2013-01-24 22:20 猿人谷阅读(476) 评论(0) 推荐(0) 编辑

c++---函数

摘要：一、函数的介绍在过程化编程中, 为了将一个较大的功能顺利实现, 通常会将这个大的功能进行分解, 例如要实现一个学生信息管理系统, 一个学生信息管理系统至少包括学生信息的添加、查询、删除、修改等功能, 这些功能要求就是对该系统的初步分解, 然后以查询功能为例对其继续分解, 查询功能可以再次分解为由以下几个功能组成的模块: ①. 获取用户查询条件 ; ②. 到数据库查询该学生信息 ; ③. 按照一定格式输出查询结果。如果感觉该功能实现起来还是比较困难那么就继续分解, 直到可以顺利实现。这些功能分解后的实现就是依靠函数, 函数在广义上理解为具有具体功能的一个模块, 在函数实... 阅读全文

posted @ 2013-01-24 08:29 猿人谷阅读(339) 评论(0) 推荐(0) 编辑

2013年1月22日

正则表达式

摘要：地狱-天堂之说,源自老程序员的话.老程序员告诉我们,没有正则表达式就像地狱一般,有了正则表达式我们就像进了天堂一样.好,我们下面看这么几个需求:需求1：“192.168.10.5[port=8080]”,这个字符串表示IP地址为192.168.10.5的服务器的8080端口是打开的，请用程序解析此字符串，然后打印出“IP地址为***的服务器的***端口是打开的”。需求2：“192.168.10.5[port=21,type=ftp]”，这个字符串表示IP地址为192.168.10.5的服务器的21端口提供的是ftp服务，其中如果“,type=ftp”部分被省略，则默认为http服务。请用程序阅读全文

posted @ 2013-01-22 08:18 猿人谷阅读(3063) 评论(0) 推荐(0) 编辑

2013年1月18日

hadoop和Hive的数据处理流程

摘要：需求场景:统计每日用户登陆总数每分钟的原始日志内容如下:http://www.blue.com/uid=xxxxxx&ip=xxxxxx假设只有两个字段,uid和ip,其中uid是用户的uid，是用户的唯一标识，ip是用户的登陆ip，每日的记录行数是10亿，要统计出一天用户登陆的总数。处理流程建表那么我们首先要在hive里建表，建表语句如下:CREATE TABLE login ( uid STRING, ip STRING)PARTITIONED BY (dt STRING)ROW FORMAT DELIMITEDFIELDS TERMINATED BY ','STO 阅读全文

posted @ 2013-01-18 17:00 猿人谷阅读(387) 评论(0) 推荐(0) 编辑

2013年1月14日

Ubuntu:带着Android的芯走着微软的路

摘要：移动操作系统的市场已经形成了三大系统三足鼎立的局面，谷歌的Android、苹果的iOS以及微软的Windows Phone三大移动移动操作占据着主要的领导地位。在Android操作系统出现的时候，市面上还有包括像诺基亚的Meego、三星Bada、Limo等小众的移动操作系统出现，经过了1年多的发展，那些年昙花一现的移动操作系统机会都宣告死亡。最近，一批新兴的移动操作系统悄然崛起，新一代MeeGo系统旗鱼(Sailfish)、Firefox OS、三星Tizen等新系统出现之后，又有一个新的移动操作系统诞生，这就是Ubuntu。Canonical发布Ubuntu系统的时候，Ubuntu创始人阅读全文

posted @ 2013-01-14 19:56 猿人谷阅读(193) 评论(0) 推荐(0) 编辑

各大建站工具中如何安装百度统计

摘要： 1、Discuz安装百度统计方法：首先在百度统计获取安装代码，然后登陆discuz后台，进入全局>站点信息>，复制统计代码并粘贴到“网站第三方统计代码”文本框中，点击提交。2、phpwind安装百度统计方法：首先在百度统计获取安装代码，然后登陆phpwind后台，进入全局>站点信息>，复制统计代码并粘贴到“网站第三方统计代码”文本框中，点击提交完成。3、DVBBS安装百度统计方法：首先在百度统计获取安装代码，然后登陆DVBBS后台，进入常规管理>论坛基本设置，复制统计代码并粘贴到“论坛版权信息”，点击提交完成。4、DeDecms安装百度统计方法：首先在百度统计获取阅读全文

posted @ 2013-01-14 19:47 猿人谷阅读(2261) 评论(0) 推荐(0) 编辑

使用bash编写Linux shell脚本--参数和子壳

摘要：为了成为一个灵活的工具，一个合格的脚本必须提供额外的信息来说明此脚本的作用，如何执行此脚本以及在哪儿执行此脚本。和命令一样脚本也使用参数。开关和参数提高了重用性同时也减少了成本，节省了时间。定位的参数有三种有效的方法可以使Linux脚本使用参数。第一种使用定位参数。脚本根据在命令行出现参数的位置调用参数。因为其他两种依赖于定位参数，所以先讨论这个。Bash变量使用“$0”标示脚本的路径。不必是全路径名，但是它定义了执行脚本所在的路径。$ printf “%s\n” “$0”/bin/bash在这个例子中，Bash会和开始命令/bin/bash。当参数命令组合了basename命令时，只留下脚本阅读全文

posted @ 2013-01-14 11:16 猿人谷阅读(2673) 评论(0) 推荐(0) 编辑