.Net读取xlsx文件Excel2007 .Net读取xlsx文件Excel2007

简单得很,利用ADO.NET,就像操作数据库一样,“insert into [Sheet1$] values(..,...,...)”

excel2007的链接字符串这样写:"provider=microsoft.ace.oledb.12.0;data source=" + @文件路径 + ";extended properties=\"excel 12.0\""

excel2003的链接字符串这样写:"provider=microsoft.jet.oledb.4.0;data source=" + @文件路径 + ";extended properties=\"excel 8.0\""
 
 
.NET 读取Excel 2007的xlsx文件和读取老的.xls文件是一样的,都是用Oledb读取,仅仅连接字符串不同而已。
读取xlsx 用的是Microsoft.Ace.OleDb.12.0;
具体操作方法如下:
public static DataTable GetExcelToDataTableBySheet(string FileFullPath, string SheetName)
{
            //string strConn = "Provider=Microsoft.Jet.OleDb.4.0;" + "data source=" + FileFullPath + ";Extended Properties='Excel 8.0; HDR=NO; IMEX=1'"; //此连接只能操作Excel2007之前(.xls)文件
            string strConn = "Provider=Microsoft.Ace.OleDb.12.0;" + "data source=" + FileFullPath + ";Extended Properties='Excel 12.0; HDR=NO; IMEX=1'"; //此连接可以操作.xls与.xlsx文件
            OleDbConnection conn = new OleDbConnection(strConn);
            conn.Open();
            DataSet ds = new DataSet();
            OleDbDataAdapter odda = new OleDbDataAdapter(string.Format("SELECT * FROM [{0}]", SheetName), conn);                    //("select * from [Sheet1$]", conn);
            odda.Fill(ds, SheetName);
            conn.Close();
            return ds.Tables[0];
  
}
   
  
读取Excel文件时,可能一个文件中会有多个Sheet,因此获取Sheet的名称是非常有用的。
  
具体操作方法如下:
  
//根据Excel物理路径获取Excel文件中所有表名
  
public static String[] GetExcelSheetNames(string excelFile)
{
            OleDbConnection objConn = null;
            System.Data.DataTable dt = null;
  
            try
            {
                //string strConn = "Provider=Microsoft.Jet.OleDb.4.0;" + "data source=" + excelFile + ";Extended Properties='Excel 8.0; HDR=NO; IMEX=1'"; //此连接只能操作Excel2007之前(.xls)文件
  
                string strConn = "Provider=Microsoft.Ace.OleDb.12.0;" + "data source=" + excelFile + ";Extended Properties='Excel 12.0; HDR=NO; IMEX=1'"; //此连接可以操作.xls与.xlsx文件
                objConn = new OleDbConnection(strConn);
                objConn.Open();
                dt = objConn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null);
                if (dt == null)
                {
                    return null;
                }
                String[] excelSheets = new String[dt.Rows.Count];
                int i = 0;
                foreach (DataRow row in dt.Rows)
                {
                    excelSheets[i] = row["TABLE_NAME"].ToString();
                    i++;
                }
  
                return excelSheets;
            }
            catch
            {
                return null;
            }
            finally
            {
                if (objConn != null)
                {
                    objConn.Close();
                    objConn.Dispose();
                }
                if (dt != null)
                {
                    dt.Dispose();
                }
            }
}

非常简单就可以读取到文件内容了,.NET就是强大。
命名空间:using System.IO;
返回路径:StreamReader sr = new StreamReader(@"路径", System.Text.Encoding.GetEncoding("GB18030")); //[设置中文编码]
读取文件:textBox1.Text = sr.ReadToEnd();
关闭流:sr.Close();

 

1 使用的命名空间为:using System.Data.OleDb;

2 连接数据库的字符串为:string myConn="Provider=Microsoft.Jet.OLEDB.4.0;Data Source=d:\\目录.xls;Extended Properties=\"Excel 8.0;HDR=No;IMEX=1\"";     
//*.xsl可以认为是数据库了,HDR表示是否隐藏excel的第一行(因为第一行一般表示字段名称)
//IMEX 参数,因为不同的模式代表著不同的读写行为:当IMEX=0 时为“汇出模式”,这个模式开启的 Excel 档案只能用来做“写入”用途。当 IMEX=1 时为“汇入模式”,这个模式开启的 Excel 档案只能用来做“读取”用途。当 IMEX=2 时为“连結模式”,这个模式开启的 Excel 档案可同时支援“读取”与“写入”用途。

3 OleDbConnection myConnection = new OleDbConnection(myConn);

4 string mySQLstr = "SELECT f1,f2,f5 FROM [Sheet1$]";       //[Sheet1$]就是表格了,选取第1,2,5列,用Fn表示第n列

5 OleDbDataAdapter myDataAdapter = new OleDbDataAdapter(mySQLstr, myConnection);

6 DataSet myDS = new DataSet();

7 myDataAdapter.Fill(myDS, "[Sheet1$]");          //原理都跟读取sql是一样O(∩_∩)O

8 DataTable dt = myConnection.GetOleDbSchemaTable(System.Data.OleDb.OleDbSchemaGuid.Tables, null);       //把相关信息记录到datatable中
   string tbname = dt.Rows[0][2].ToString().Trim();              //读取表名信息

【注意】
由于excel每个单元格内数据默认的格式为:varchar(255),因此读取超过255的单元格内容是需要修改注册表,这里提供修改方法:
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel]
"TypeGuessRows"="0"

表示从前TypeGuessRows行判断数据的类型,如果还是读取不正确,使用最笨的办法是第一行的该字段后面添加255个空格,此法管用,但是个人感觉不完美啊。

posted on 2012-03-08 12:03  chennie  阅读(667)  评论(0编辑  收藏  举报