hbase源码分析:ERROR: Table already exists问题诊断

问题描述:

重新安装了测试环境的hadoop,所以之前hbase所建的表数据都丢失了,但是zookeeper没有动。在hbase shell中list的时候,看不到之前建的表,但是create test table的时候,却报错提示"ERROR: Table already exists: test!". 

问题追踪:

1,在list的时候,没有显示之前建的表,也就是没有感知到之前建的表,但是create时候却感知到了之前建的表,所以很自然需要看一下list和create的时候,server执行的逻辑。只要清楚了这个逻辑,问题便一清二楚了。

2,list时server端的逻辑其实很简单。list的时候master端执行的逻辑的入口函数是listTableDescriptors。核心代码如下:

  

 1         // request for all TableDescriptors
 2         Collection<HTableDescriptor> htds;
 3         if (namespace != null && namespace.length() > 0) {
 4           htds = tableDescriptors.getByNamespace(namespace).values();
 5         } else {
 6           htds = tableDescriptors.getAll().values();
 7         }
 8 
 9         for (HTableDescriptor desc: htds) {
10           if (includeSysTables || !desc.getTableName().isSystemTable()) {
11             descriptors.add(desc);
12           }
13         }

可以看到是从tableDescriptors中获取的,而tableDescriptors是根据hbase在hdfs中路径的描述

1     this.tableDescriptors = new FSTableDescriptors(
2       this.conf, this.fs, this.rootDir, !canUpdateTableDescriptor(), false);

然后可以看到这些信息是从hbase在hdfs中的rootpath下的data目录中获取表相关信息的。所以,list的时候当然看不见之前的表了。

3,create table的时候,在server端最终会使用createTableHandler或者createTableProcedure来处理建表的逻辑。在createTableProcedure中正式建表之前,会调用prepareCreate函数。

 1 private boolean prepareCreate(final MasterProcedureEnv env) throws IOException {
 2     final TableName tableName = getTableName();
 3     if (MetaTableAccessor.tableExists(env.getMasterServices().getConnection(), tableName)) {
 4       setFailure("master-create-table", new TableExistsException(getTableName()));
 5       return false;
 6     }
 7     // During master initialization, the ZK state could be inconsistent from failed DDL
 8     // in the past. If we fail here, it would prevent master to start.  We should force
 9     // setting the system table state regardless the table state.
10     boolean skipTableStateCheck =
11         !(env.getMasterServices().isInitialized()) && tableName.isSystemTable();
12     if (!skipTableStateCheck) {
13       TableStateManager tsm = env.getMasterServices().getAssignmentManager().getTableStateManager();
14       if (tsm.isTableState(tableName, true, ZooKeeperProtos.Table.State.ENABLING,
15           ZooKeeperProtos.Table.State.ENABLED)) {
16         LOG.warn("The table " + tableName + " does not exist in meta but has a znode. " +
17                "run hbck to fix inconsistencies.");
18         setFailure("master-create-table", new TableExistsException(getTableName()));
19         return false;
20       }
21     }
22     return true;
23   }

在14行,通过TableStateManager会检查zookeeper对应的表状态是不是enable的,检查zk中的路径是hbase root path下的table目录。由于zk还是之前的zk,所以之前建的表信息还在,很自然这时候会检查已经存在,如是报了Table already exits的错误。Log提示中说用hbck去检查,但是貌似检查不出来是不一致的。

问题解决:

本来想通过hbck去检查,然后修复的,但是貌似hbck检查不出来。所以只是简单暴力的把zk中对应的table删除,然后create就没问题了。

 

posted @ 2016-10-07 18:52  超级核弹头  阅读(5483)  评论(1编辑  收藏  举报