数据采集之Loader
Loader是实现FusionInsight HD与关系型数据库、文件系统之间交换数据和文件的数据加载工具。
- 提供可视化向导式的作业配置管理界面;
- 提供定时调度任务,周期性执行Loader作业;
- 在界面中可指定多种不同的数据源、配置数据的清洗和转换步骤、配置集群存储系统等。
基于开源Sqoop研发,做了大量优化和扩展。
Loader实现FusionInsight与关系型数据库、文件系统之间交换数据和文件,可以将数据从关系型数据库/文件服务器导入到FusionInsight HDFS/HBase/Hive中,或者反过来从Hadoop HDFS/HBase导出到关系型数据库/文件服务器中。
Loader提供了本集群内部HDFS和HBase之间的数据导入/导出。
RDB,Relational Data Base,关系型数据库。
Customized Data Source:支持插件式,扩展外部数据源。
Load特征:
- 图形化,提供图形化配置、监控界面,操作简便。
- 高性能,利用MapReduce并行处理数据。
- 高可靠,Loader Server采用主备双机。 作业通过MapReduce执行,支持失败重试。 作业失败后,不会残留数据。
- 安全,Kerberos认证 作业权限管理。