06 2016 档案

摘要:转 爬虫的定向爬取与垂直搜索 定向爬虫是网络爬虫的一种。 定向爬虫 定向爬虫可以精准的获取目标站点信息。 定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。 优势: 基于模版的信息提取技术,能提供更加精准的信息。比如价格,房屋面积,时间,职位,公司名等等。 劣势: 目标 阅读全文
posted @ 2016-06-30 16:39 dy9776 阅读(773) 评论(0) 推荐(0) 编辑
摘要:转 目前网络上开源的网络爬虫以及一些简介和比较 目前网络上有不少开源的网络爬虫可供我们使用,爬虫里面做的最好的肯定是google ,不过google公布的蜘蛛是很早的一个版本,下面是几种开源的网络爬虫的简单对比表: 下面我们再对Nutch、Larbin、Heritrix这三个爬虫进行更细致的比较: 阅读全文
posted @ 2016-06-30 16:36 dy9776 阅读(555) 评论(0) 推荐(0) 编辑
摘要:SQL中的等号、IN、LIKE三者的比较SQL 中等号、IN、LIKE 三者都可以用来进行数据匹配 。但三者并不相同。 等号是用来查找与单个值匹配的所有数据; IN 是 用来查找 与多个值匹配的所有数据; 而 LIKE用来查找与一个模式匹配的所有数据。 1.等号 确切知道所要查 确切知道所要查找的内 阅读全文
posted @ 2016-06-28 19:52 dy9776 阅读(1542) 评论(0) 推荐(0) 编辑
摘要:转 “Sql Server参数化查询之where in和like实现详解 文章导读 拼SQL实现where in查询 使用CHARINDEX或like实现where in 参数化 使用exec动态执行SQl实现where in 参数化 为每一个参数生成一个参数实现where in 参数化 使用临时表 阅读全文
posted @ 2016-06-28 19:42 dy9776 阅读(381) 评论(0) 推荐(0) 编辑
摘要:问题前提: 当输入价格的时候,往往是不清楚是整数还是小数,想最后是当用户输入是整数的时候就自动变为整数,输入小数变为小数,而且价格是要求是大于0的数字, 这样才合理,下面是我的尝试, 用正则表达式 1.开始的时候写了一个能够判断为整数的方法 /** * 判断是否为大于0的整数 * * @param 阅读全文
posted @ 2016-06-28 11:31 dy9776 阅读(1417) 评论(0) 推荐(0) 编辑
摘要:1.插入: INSERT INTO 表名称 VALUES (值1, 值2,....) 我们也可以指定所要插入数据的列: INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....) 2.查找 SQL SELECT 语句 SELECT 语句用于从表中 阅读全文
posted @ 2016-06-27 11:07 dy9776 阅读(720) 评论(0) 推荐(0) 编辑
摘要:Oracle基本命令 前言:... 3 连接数据库:... 3 使用sql*plus连接oracle. 3 命令方式... 3 文件操作命令... 3 显示和设置环境变量... 3 查看当前所有表... 4 查询当前日期... 4 查看本用户下的各种对象的SQL脚本... 4 表空间管理... 5 阅读全文
posted @ 2016-06-27 10:46 dy9776 阅读(5393) 评论(0) 推荐(0) 编辑
摘要:1.就是首先将需求中的变于不变进行确定 2,不变的东西首先将其进行 确定, 而那些最能变的东西要将其进行逻辑上的是抽象,抽象最高的最好使接口, 最为核心的思想是将 变得东西你最好将其进行先抽象出来,而后其如何进行变进行进一步进的细化 ,对其进行留出来一些余地,以用来以后的变化 设计模式可能在一些需求 阅读全文
posted @ 2016-06-25 20:49 dy9776 阅读(191) 评论(0) 推荐(0) 编辑
摘要:1. 实现参照完整性 指若两个表之间具有主从关系(即主外键关系),当删除主表数据时,必须确保相关的从表数据已经被删除. 当修改主表的主键列数据时,必须确保相关从表数据已经被修改.为了实现级联删除,可在定义外部键约束时指定ON DELETE CASCADE关键字 alter table emp add 阅读全文
posted @ 2016-06-25 18:17 dy9776 阅读(1516) 评论(0) 推荐(0) 编辑
摘要:由于oracle中是没有自动增长的的,需要自己去进行写触发器等方式去进行设置: 找了一下他人写的,有两种方法可以设置主键,一种是自增长主键,另一种就是生成唯一序列。 一、自增长主键 我创建一个用户的信息表 -- Create tablecreate table USERINFO( USERNO NU 阅读全文
posted @ 2016-06-24 19:20 dy9776 阅读(27845) 评论(0) 推荐(0) 编辑
摘要:Oracle 角色管理 一、何为角色 角色:角色是一组权限的集合,将角色赋给一个用户,这个用户就拥有了这个角色中的所有权限.二、系统预定义角色 预定义角色是在数据库安装后,系统自动创建的一些常用的角色。 下介简单的介绍一下这些预定角色。角色所包含的权限可以用以下语句查询: sql>select * 阅读全文
posted @ 2016-06-23 15:37 dy9776 阅读(305) 评论(0) 推荐(0) 编辑
摘要:先对其进行介绍: 数据清洗(Data cleaning)– 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。[1] 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为 阅读全文
posted @ 2016-06-22 20:11 dy9776 阅读(3891) 评论(0) 推荐(0) 编辑
摘要:网上搜了一下,对Hbuider的快捷键 另外还有一些实用的组合键: Alt+T→V (检验语法文档) Alt+L→H (代码历史版本) 阅读全文
posted @ 2016-06-22 19:51 dy9776 阅读(343) 评论(0) 推荐(0) 编辑
摘要:1、下载Oracle Instant Client (32-bit) 因为PL/SQL只支持32位的Oracle,所以必须下载对应的32位的才可以。 只需要下载instantclient-basic-nt-11.2.0.3.0.zip就可以了,其它的都是一些根据不同需要扩展的包。 下载地址:http 阅读全文
posted @ 2016-06-21 19:19 dy9776 阅读(1260) 评论(0) 推荐(0) 编辑
摘要:1.print 1.1 Print是一个函数 在Python3中print是个函数,这意味着在使用的时候必须带上小括号,并且它是带有参数的。 >>> print 'hello world' SyntaxError: Missing parentheses in call to 'print' >>> 阅读全文
posted @ 2016-06-21 16:40 dy9776 阅读(1270) 评论(0) 推荐(0) 编辑
摘要:原创 http://www.cnblogs.com/nucdy/p/5603998.html 参考视屏:链接: https://pan.baidu.com/s/1kViEZQZ 密码: z7ha (环境:oracle11g, linux64 RHEL6) 安装RHEL6 假设你已经正确安装VM软件并 阅读全文
posted @ 2016-06-21 16:13 dy9776 阅读(208013) 评论(16) 推荐(9) 编辑
摘要:crawler 开发 语言 功能 单一 支持分布式 爬取 效率 镜像 保存 Nutch Java × √ 低 × Larbin C++ √ × 高 √ Heritrix Java √ × 中 √ ************** Larbin开发语言:C++http://larbin.sourcefor 阅读全文
posted @ 2016-06-20 17:03 dy9776 阅读(1265) 评论(0) 推荐(0) 编辑
摘要:先添加上连接oracle,MySQL的驱动路径和数据库连接URL: MySQL: final String DBDRIVER = "org.gjt.mm.mysql.Driver" ; final String DBURL = "jdbc:mysql://localhost/mldn" ; fina 阅读全文
posted @ 2016-06-20 17:00 dy9776 阅读(662) 评论(0) 推荐(0) 编辑
摘要:暂时变为英文:export LANG=en_US.UTF-8 可以保证你暂时安装oracle没有问题,不出现框框。但是,要说彻底改为英语环境下的时候,用下面: root 用户下可以 1。bash环境 编辑/etc/bashrc环境文件,加入一行 export LC_ALL=en_US.UTF-8 2 阅读全文
posted @ 2016-06-19 18:02 dy9776 阅读(3247) 评论(0) 推荐(0) 编辑
摘要:1.出现了:Environment variable ORACLE_UNQNAME not defined. Please set ORACLE_UNQNAME to da tabase unique name. 解决办法:oracle的环境变量UNQNAME没设或设置不正确export ORACL 阅读全文
posted @ 2016-06-19 10:40 dy9776 阅读(328) 评论(0) 推荐(0) 编辑
摘要:我们经常见到的几种最为常用的windows下远程管理Linux服务器的方法,基本上都是利用SecureCRT,或者是PUTTY等客户端工具通过ssh服务来实现Windows下管理Linux服务器的,这些客户端工具几乎不需要什么配置,使用简单,但是它们都无法启动窗口服务的程序或进程,也无法达到远程桌面 阅读全文
posted @ 2016-06-15 13:38 dy9776 阅读(15404) 评论(0) 推荐(0) 编辑
摘要:转载: Linux ext2/ext3文件系统使用索引节点来记录文件信息,作用像windows的文件分配表。索引节点是一个结构,它包含了一个文件的长度、创建及修改时间、权限、所属关系、磁盘中的位置等信息。一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一一个元素对应。系统给 阅读全文
posted @ 2016-06-14 17:19 dy9776 阅读(1257) 评论(0) 推荐(0) 编辑
摘要:别让SSD成半吊子!你真的4K对齐了吗? http://ssd.zol.com.cn/537/5374950_all.html SSD固态硬盘一键分区后如何检测4K对齐? http://pcedu.pconline.com.cn/548/5480481.html http://xiazai.zol. 阅读全文
posted @ 2016-06-14 09:24 dy9776 阅读(717) 评论(0) 推荐(0) 编辑
摘要:Linux CentOS 6.5 中安装与配置JDK-7:http://jingyan.baidu.com/article/fc07f9891d186512ffe51935.html jdk7的下载:http://www.oracle.com/technetwork/java/javase/down 阅读全文
posted @ 2016-06-04 16:13 dy9776 阅读(238) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示