C#操作Excel的几种方法

(1) OleDb：用这种方法读取Excel速度还是非常的快的，但这种方式读取数据的时候不太灵活，不过可以在 DataTable 中对数据进行一些删减修改

这种方式将Excel作为一个数据源，直接用Sql语句获取数据了。所以读取之前要知道此次要读取的Sheet（当然也可以用序号，类似dt.Row[0][0]。这样倒是不需要知道Sheet）

if (fileType
 == ".xls")

   connStr
 = "Provider=Microsoft.Jet.OLEDB.4.0;" +
"Data
 Source=" +
 fileName + ";" +
";Extended
 Properties=\"Excel 8.0;HDR=YES;IMEX=1\"";

else

   connStr
 = "Provider=Microsoft.ACE.OLEDB.12.0;" +
"Data
 Source=" +
 fileName + ";" +
";Extended
 Properties=\"Excel 12.0;HDR=YES;IMEX=1\"";

 

OleDbConnection
 conn new OleDbConnection(connStr);

DataTable
 dtSheetName = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, new object[]
 { null,
null,
null,
"TABLE" });

以上是读取Excel的Sheet名，xls和xlsx的连接字符串也不一样的，可以根据文件的后缀来区别。这里需要注意的一点，Excel里面只有一个Sheet，但通过这种方式读取Sheet可能会大于一个。原因已经有人在别的网站说过了，偷一下懒O(∩_∩)O，下面文段来自【cdwolfling】

【在使用过程中发现取出的Sheet和实际excel不一致，会多出不少。目前总结后有两种情况：

1. 取出的名称中，包括了XL命名管理器中的名称（参见XL2007的公式--命名管理器，快捷键Crtl+F3）；

2. 取出的名称中，包括了FilterDatabase后缀的，这是XL用来记录Filter范围的，参见http://www.mrexcel.com/forum/showthread.php?t=27225；

对于第一点比较简单，删除已有命名管理器中的内容即可；第二点处理起来比较麻烦， Filter删除后这些名称依然保留着，简单的做法是新增sheet然后将原sheet Copy进去】

---------------------------------

但实际情况并不能为每个Excel做以上检查，【cdwolfling】也给出了过滤的方案，当时还是有点问题，本来补充了一点。总之先看代码吧

for (int i = 0; i < dtSheetName.Rows.Count; i++)

{

SheetName
 = (string)dtSheetName.Rows[i]["TABLE_NAME"];

 

if (SheetName
 .Contains("$")
 && !SheetName .Replace("'",
"").EndsWith("$"))continue;//过滤无效SheetName完毕....

da.SelectCommand = new OleDbCommand(String.Format(sql_F, tblName), conn);
DataSet dsItem = new DataSet();
da.Fill(dsItem, tblName);

}

因为读取出来无效SheetName一般情况最后一个字符都不会是$。如果SheetName有一些特殊符号，读取出来的SheetName会自动加上单引号，比如在Excel中将SheetName编辑成：MySheet(1)，此时读取出来的SheetName就为：'MySheet(1)$'，所以判断最后一个字符是不是$之前最好过滤一下单引号。

优点：读取方式简单、读取速度快

缺点：除了读取过程不太灵活之外，这种读取方式还有个弊端就是，当Excel数据量很大时。会非常占用内存，当内存不够时会抛出内存溢出的异常。

不过一般情况下还是非常不错的

读取Excel完整代码：

(2)：Com组件的方式读取Excel

这种方式需要先引用 Microsoft.Office.Interop.Excel 。首选说下这种方式的优缺点

优点：可以非常灵活的读取Excel中的数据

缺点：如果是Web站点部署在IIS上时，还需要服务器机子已安装了Excel，有时候还需要为配置IIS权限。最重要的一点因为是基于单元格方式读取的，所以数据很慢（曾做过试验，直接读取千行、200多列的文件，直接读取耗时15分钟。即使采用多线程分段读取来提高CPU的利用率也需要8分钟。PS：CPU I3）

需要读取大文件的的童鞋们慎重。。。

附上单线程和多线程读取类：

posted @ 2014-03-02 13:10 奔跑的鸡丝阅读(1226) 评论(0) 收藏举报

刷新页面返回顶部

奔跑的鸡丝

C#操作Excel的几种方法

公告