oracle_job 清空冗余数据 ,每一分钟执行一次

参照这个例子:http://cherryqq.iteye.com/blog/855022

 思路: data表中有4条数据 ,relation有3条数据,通过data_id 对应,需要定时删除 data表中在relation表中没有data_id引向的数据,

通过存储过程+job的方式。

已有表结构 

tab_page_data

create table TAB_PAGE_DATA
(
  DATA_ID         CHAR(32) not null,
  PAGE_ID         NUMBER not null,
  PARENT_ID       NUMBER,
  SYSTEM_ID       NUMBER,
  EXTENSION       VARCHAR2(255),
  CREATEDTIME     DATE,
  TITLE           VARCHAR2(255),
  AUTHORS         VARCHAR2(255),
  DOMAIN          VARCHAR2(255),
  CONTENT         CLOB,
  CONTENTLENGTH   NUMBER,
  SUMMARY         VARCHAR2(1000),
  CLASSIFY_DIR_ID NUMBER,
  FLAG            NUMBER
)

tab_page_relation

create table TAB_PAGE_RELATION
(
  UNIQUE_ID         CHAR(32) not null,
  DATA_ID           CHAR(32),
  NICK_ID           NUMBER,
  URL               VARCHAR2(512),
  UPDATE_TIME       DATE default sysdate,
  INSERT_TIME       DATE default sysdate not null,
  LAST_CRAWLER_TIME DATE default sysdate
)

tab_page_data插入测试数据 四条

insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('b3764d3494655859cd0de9309f3376d6', 0, 0, 1, 'html', to_date('30-10-2013 11:55:27', 'dd-mm-yyyy hh24:mi:ss'), 'AutoCADArchitecture2010中国标准件库', '', '鹏宇成MIS管理系统', 'test', 4762, 'test', null, null);

insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('0f8342f81e3931ce8667f001409aef03', 0, 0, 1, 'html', to_date('30-10-2013 11:59:02', 'dd-mm-yyyy hh24:mi:ss'), '在安装AIP的模块的时候会出现1722或1904错误', '', '鹏宇成MIS管理系统', 'test', 12311, 'test', null, null);

insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('6fd0b3d8bddf94a4c59a467a893eaab7', 0, 0, 2, 'html', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), '无障碍台盆', '', '鹏宇成公司网', 'test', 62694, 'test', null, null);

insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('62cfc3e5aec21b533eac4358d39cab56', 0, 0, 1, 'html', to_date('30-10-2013 12:27:58', 'dd-mm-yyyy hh24:mi:ss'), 'Autodesk产品服务详细介绍', '', '鹏宇成MIS管理系统', 'test', 6889, 'test', null, null);

  tab_page_relation  三条

insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('00244IUVNKIG0FMKJIO6SO8T1R100010', 'b3764d3494655859cd0de9309f3376d6', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=1109&p=17&y=1&id=', to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'));

insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('00014HT98UKDD6IVHOR5VVLSAF100010', '0f8342f81e3931ce8667f001409aef03', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=332&p=2&y=1&id=1', to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'));

insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('0012RS6G1LNPOJV7SQBUSI2LLF100010', '6fd0b3d8bddf94a4c59a467a893eaab7', 10000, 'http://www1.pyc.com.cn/Application/Family.aspx?pid=319', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'));

创建历史记录表

CREATE TABLE TAB_PAGE_DATA_HISTORY AS SELECT * FROM tab_page_data WHERE 1=2;

在plsql下 创建存储过程 

PRO_PAGE_DATA_CLEAR
CREATE OR REPLACE PROCEDURE PRO_PAGE_DATA_CLEAR IS
  DATAID NUMBER(32);
BEGIN
  INSERT INTO TAB_PAGE_DATA_HISTORY
    SELECT *
      FROM TAB_PAGE_DATA TPDD
     WHERE TPDD.DATA_ID IN
           (SELECT TPD.DATA_ID
              FROM TAB_PAGE_DATA TPD
             WHERE TPD.DATA_ID NOT IN
                   (SELECT DISTINCT TPR.DATA_ID FROM TAB_PAGE_RELATION TPR));
  COMMIT;
END PRO_PAGE_DATA_CLEAR;

  在oracle服务器本机sqlplus / as sysdba 本机登陆 登陆用户  conn pyc3/pyc3

创建一个job,名称为job2013 ;作用是每分钟(60×24=1440)执行一次存储过程PRO_PAGE_DATA_CLEAR

SQL> variable job2013 number;
SQL> begin
2 dbms_job.submit(:job2013,'PRO_PAGE_DATA_CLEAR;',sysdate,'sysdate+1/1440');
3 end;
4 /

PL/SQL 过程已成功完成。

运行job2013

SQL> begin
2 dbms_job.run(:job2013);
3 end;
4 /

PL/SQL 过程已成功完成。

查看运行效果 。

select * from tab_page_data_history;

停止job

SQL> begin

  2  dbms_job.remove(:job2013);

  3  end;

  4  /

 

===========================================

6,查询jobs的相关视图

select job,last_date,last_sec,broken,failures,interval, what from dba_jobs

详解 dba_jobs中几个比较重要的字段

job: 指的是job的id号。比如上面的 41

failures:job执行的时候失败次数,如果超过了15次,那么broken列将被标为Y,以后就不会运行该job了

broken:默认为N,如果为Y,意味着不再执行该job!

interval:执行job的间隔时间。

what:该job的实际工作。

二:job 的相关知识:

1,DBA_JOBS

DBA_JOBS

===========================================

字段(列) 类型 描述

JOB NUMBER 任务的唯一标示号

LOG_USER VARCHAR2(30) 提交任务的用户

PRIV_USER VARCHAR2(30) 赋予任务权限的用户

SCHEMA_USER VARCHAR2(30) 对任务作语法分析的用户模式

LAST_DATE DATE 最后一次成功运行任务的时间

LAST_SEC VARCHAR2(8) 如HH24:MM:SS格式的last_date日期的小时,分钟和秒

THIS_DATE DATE 正在运行任务的开始时间,如果没有运行任务则为null

THIS_SEC VARCHAR2(8) 如HH24:MM:SS格式的this_date日期的小时,分钟和秒

NEXT_DATE DATE 下一次定时运行任务的时间

NEXT_SEC VARCHAR2(8) 如HH24:MM:SS格式的next_date日期的小时,分钟和秒

TOTAL_TIME NUMBER 该任务运行所需要的总时间,单位为秒

BROKEN VARCHAR2(1) 标志参数,Y标示任务中断,以后不会运行

INTERVAL VARCHAR2(200) 用于计算下一运行时间的表达式

FAILURES NUMBER 任务运行连续没有成功的次数

WHAT VARCHAR2(2000) 执行任务的PL/SQL块

CURRENT_SESSION_LABEL RAW MLSLABEL 该任务的信任Oracle会话符

CLEARANCE_HI RAW MLSLABEL 该任务可信任的Oracle最大间隙

CLEARANCE_LO RAW MLSLABEL 该任务可信任的Oracle最小间隙

NLS_ENV VARCHAR2(2000) 任务运行的NLS会话设置

MISC_ENV RAW(32) 任务运行的其他一些会话参数

--------------------------

2,描述 INTERVAL参数值

每天午夜12点: 'TRUNC(SYSDATE + 1)'

每天早上8点30分: 'TRUNC(SYSDATE + 1) + (8*60+30)/(24*60)'

每星期二中午12点: 'NEXT_DAY(TRUNC(SYSDATE ), ''TUESDAY'' ) + 12/24'

每个月第一天的午夜12点: 'TRUNC(LAST_DAY(SYSDATE ) + 1)'

每个季度最后一天的晚上11点: 'TRUNC(ADD_MONTHS(SYSDATE + 2/24, 3 ), 'Q' ) -1/24'

每星期六和日早上6点10分: 'TRUNC(LEAST(NEXT_DAY(SYSDATE, ''SATURDAY"), NEXT_DAY(SYSDATE, "SUNDAY"))) + (6×60+10)/(24×60)'

每月25号00:00执行: 'TRUNC(LAST_DAY(SYSDATE ) + 25)'

--------------------------

1:每分钟执行

Interval => TRUNC(sysdate,'mi') + 1/ (24*60)

Interval => sysdate+1/1440

 

2:每天定时执行

例如:每天的凌晨1点执行

Interval => TRUNC(sysdate) + 1 +1/ (24)

 

3:每周定时执行

例如:每周一凌晨1点执行

Interval => TRUNC(next_day(sysdate,'星期一'))+1/24

 

4:每月定时执行

例如:每月1日凌晨1点执行

Interval =>TRUNC(LAST_DAY(SYSDATE))+1+1/24

 

5:每季度定时执行

例如每季度的第一天凌晨1点执行

Interval => TRUNC(ADD_MONTHS(SYSDATE,3),'Q') + 1/24

 

6:每半年定时执行

例如:每年7月1日和1月1日凌晨1点

Interval => ADD_MONTHS(trunc(sysdate,'yyyy'),6)+1/24

 

7:每年定时执行

例如:每年1月1日凌晨1点执行

Interval =>ADD_MONTHS(trunc(sysdate,'yyyy'),12)+1/24

3. 查看相关job信息

相关视图

dba_jobs

all_jobs

user_jobs

dba_jobs_running 包含正在运行job相关信息

posted @ 2013-12-22 16:45  cphmvp  阅读(3118)  评论(0编辑  收藏  举报
爬虫在线测试小工具: http://tool.haoshuju.cn/