对Aspose.Cells Excel文件操作的扩展

                  工作中对Excel操作的需求很是常见,今天其他项目组的同事在进行Excel数据导入时,使用Aspose.Cells Excel 遇到了些问题。

                  刚好闲来不忙,回想自己用过的Excel文件操作,有NPOI /自己封装的 ExcelHelper(基于AccessDatabaseEngine.exe)/ MyXls / Aspose.Cells ,多而杂。自己本地有时做数据处理常常使用自己的ExcelHelper做数据处理,因为很方便,可以拿当Excel当数据库一

样来用。 但唯一不爽的是首先电脑上得安装 AccessDatabaseEngine.exe ,那么如果是服务器,多台服务器,如都使用了基于 这种方法的Excel ,还得再给服务器安装 AccessDatabaseEngine.exe,甚是麻烦。

                 看看自己的ExcelHelper ,自己想固定一种封装好自己的常用Excel文件操作方式,前段时间用了Aspose.Cells 操作Excel ,也感觉甚是方便,结合自己的ExcelHelper ,就有了新的想法:如果Aspose.Cells 还有自己不习惯用的地方,那我就扩展。

       分享下我常用的ExcelHelper:http://git.oschina.net/lztkdr/codes/nr9z153jtq7xvbm28fwkg

     下面分享下,我新封装的基于Aspose.Cells的 扩展方法:  

     1. GetSheetNames 获取Excel文件的所有 sheetName。

     2. GetColumnNames 获取当前所有 工作表的所有列。

     3. GetSheetData 像Sql查询一样,对已经工作表的数据 查询筛选。

                4. GetAllSheetData 得到Excel 文件的所有 工作表数据。  

using System;
using System.Collections.Generic;
using System.Data;
using System.Linq;

namespace Aspose.Cells
{

    /// <summary>
    /// Aspose.Cells Excel文件操作 扩展
    /// </summary>
    public static class AsposeCellsExtensions
    {

        /// <summary>
        /// 快速创建一个含有指定列的DataTable
        /// </summary>
        /// <param name="data">new DataTable().CreateDataTable</param>
        /// <param name="columnNames">列名</param>
        /// <returns></returns>
        public static DataTable CreateDataTable(this DataTable data, params string[] columnNames)
        {
            data = data ?? new DataTable();
            if (columnNames != null && columnNames.Length > 0)
            {
                data.Columns.AddRange(columnNames.Select(t => new DataColumn(t)).ToArray());
            }
            return data;
        }


        /// <summary>
        /// 获取当前Exel的所有SheetName
        /// </summary>
        /// <param name="this"></param>
        /// <returns></returns>
        public static List<string> GetSheetNames(this Workbook @this)
        {
            if (@this == null) throw new ArgumentNullException("@this");
            return @this.Worksheets.Select(t => t.Name).ToList();
        }

        /// <summary>
        /// 获取当前Sheet的所有 列名(注:第一行是列名标题,不作为数据使用)
        /// </summary>
        /// <param name="this"></param>
        /// <returns>获取所有列名</returns>
        public static List<string> GetColumnNames(this Worksheet @this)
        {
            if (@this == null) throw new ArgumentNullException("@this");
            List<string> lstColNames = new List<string>();
            for (int j = 0; j <= @this.Cells.MaxDataColumn; j++)
            {
                lstColNames.Add(@this.Cells[0, j].DisplayStringValue);
            }
            return lstColNames;
        }

        /// <summary>
        /// 查询表中的数据,查询指定行,过滤指定值(注:第一行是列名标题,不作为数据使用)
        /// </summary>
        /// <param name="this"></param>
        /// <param name="sheetName">表名</param>
        /// <param name="selectColumns">列名,多列名用逗号(",")隔开</param>
        /// <param name="whereFilter">过滤行数据的 表达式</param>
        /// <returns></returns>
        public static DataTable GetSheetData(this Workbook @this, string sheetName, string selectColumns = "*", string whereFilter = "")
        {
            if (@this == null) throw new ArgumentNullException("@this");
            Worksheet wsh = @this.Worksheets[sheetName];
            if (wsh == null) throw new ArgumentNullException("未找到【" + sheetName + "");

            string[] columnNames = { };
            if (selectColumns != "*")
            {
                columnNames = selectColumns.Split(new string[] { "," }, StringSplitOptions.RemoveEmptyEntries);
                if (columnNames.Length <= 0)
                {
                    throw new ArgumentException("查询的列头不正确【" + selectColumns + "");
                }
            }

            DataTable data = null;
            if (selectColumns == "*")
            {
                data = wsh.Cells.ExportDataTable(0, 0, wsh.Cells.MaxDataRow + 1, wsh.Cells.MaxDataColumn + 1);
            }
            else
            {
                #region 查到 列名 所在 位置
                List<int> lstIndex = new List<int>();
                for (int j = 0; j <= wsh.Cells.MaxDataColumn; j++)
                {
                    Cell cell = wsh.Cells[0, j];
                    if (columnNames.Contains(cell.DisplayStringValue, StringComparer.OrdinalIgnoreCase))
                    {
                        lstIndex.Add(cell.Column);
                    }
                }
                #endregion
                data = wsh.Cells.ExportDataTable(0, 0, wsh.Cells.MaxDataRow + 1, columnNames.Length, new ExportTableOptions() { Indexes = lstIndex.ToArray() });
            }

            #region 第一行数据的值 即是 当前的列名称
            for (int j = 0; j < data.Columns.Count; j++)
            {
                data.Columns[j].ColumnName = data.Rows[0][j].ToString();
            }
            data.Rows.RemoveAt(0);
            #endregion

            if (!string.IsNullOrWhiteSpace(whereFilter))
            {
                var dv = data.DefaultView;
                dv.RowFilter = whereFilter;
                data = dv.ToTable();
            }
            return data;
        }


        /// <summary>
        /// 获取所有数据
        /// </summary>
        /// <param name="this">Excel Workbook 对象</param>
        /// <param name="HDR_YES">第一行是列名标题,不作为数据使用</param>
        /// <returns>表名对应的数据 集合</returns>
        public static Dictionary<string, DataTable> GetAllSheetData(this Workbook @this,bool HDR_YES = true)
        {
            if (@this == null) throw new ArgumentNullException("@this");
            Dictionary<string, DataTable> dict = new Dictionary<string, DataTable>();
            var lstName = GetSheetNames(@this);
            foreach (string sheetName in lstName)
            {
                if (HDR_YES)
                {
                    dict.Add(sheetName, GetSheetData(@this, sheetName));
                }
                else
                {
                    dict.Add(sheetName, @this.Worksheets[sheetName].Cells.ExportDataTable(0, 0,
                        @this.Worksheets[sheetName].Cells.MaxDataRow + 1, @this.Worksheets[sheetName].Cells.MaxDataColumn + 1));
                }
            }
            return dict;
        }
    }
}

      使用方式:                 

            string file = Path.GetFullPath(@"..\..\Excel\BA02利润表_temp.xlsx");

            Workbook wk = new Aspose.Cells.Workbook(file);

            List<string> lstSheetName = wk.GetSheetNames();

            Worksheet wsh = wk.Worksheets["sheet2"];

            var lst = wsh.GetColumnNames();

            var data = wk.GetSheetData("Sheet2", "行次,级别", "行次<=10");

            var dict = wk.GetAllSheetData();

 

posted @ 2017-06-27 14:26  TakeTry  阅读(606)  评论(0编辑  收藏  举报