VS2010+MFC解析Excel文件

----------------------------------------------------------------------------------------------------------------

当前平台 EXCEL 2007 + VS2010

http://wenku.baidu.com/view/7aff9a1cc77da26925c5b0d9.html

----------------------------------------------------------------------------------------------------------------

向工程添加Excel的C++操作类。具体步骤见下图:
1.Ctrl+Shift+X 打开类向导。

2.添加“类型库中MFC类”。此处操作与VC6.0有很大的不一样,让我找了半天,如下图:

3.添加需要的类文件。如下图:

4.将刚才导入的类头文件,加到模块中。

 

转载请注明原文网址:

http://www.cnblogs.com/xianyunhe/archive/2011/09/25/2190485.html

通过VC实现对Excel表格的操作的方法有多种,如:通过ODBC数据库实现,通过解析Excel表格文件,通过OLE/COM的实现。本文主要研究通过OLE/COM实现对Excel表格的操作。

 

本文源码的应用环境说明:

Windows XP SP3

Microsoft Visual Studio 2010

Microsoft Office Excel 2007

 

1、添加OLE/COM支持。

首先,应用程序必须添加对OLE/COM的支持,才能导入OLE/COM组件。

本文使用的是MFC对话框程序,在创建工程的向导中选中Automation选项即可为程序自动添加相应的头文件和OLE库初始化代码。

通过查看源代码,可以知道在stdafx.h的头文件中,添加了OLE/COM很多类所需添加的头文件。

#include <afxdisp.h> // MFC 自动化类

同时,在应用程序类的InitInstance函数中,添加了OLE/COM的初始化代码,如下所示:

// 初始化 OLE 库

if (!AfxOleInit())

{

AfxMessageBox(IDP_OLE_INIT_FAILED);

return FALSE;

}

2、导入并封装Excel中的接口

Excel作为OLE/COM库插件,定义好了各类交互的接口,这些接口是跨语言的接口。VC可以通过导入这些接口,并通过接口来对Excel的操作。

由于本文只关心对Excel表格中的数据的读取,主要关注几个_ApplicationWorkbooks_WorkbookWorksheets_WorksheetRange等几个接口。Excel的各类接口的属性、方法可以通过MSDNOffice Development进行查询。

VS2010导入OLE/COM组件的接口的步骤为:Project->Class Wizard->Add Class->MFC Class From TypeLib,先选择要导入的组件所在的路径,即Excel.exe所在的路径,然后再选择

要导入的Excel类型库中的接口。

在完成接口导入后,VS2010将自动为导入的接口创建相应的实现类,用于对接口属性和方法的实现。由于标准的C++没有属性访问器,只能添加一个两个存取函数来实现对属性的访问,通过在属性名称前加上get_put_前缀分别实现对属性的读写操作。即,由VC自动完成C++类对接口的封装。

 

本文所导入的接口对应的类和头文件的说明如下所示:

 

Excel接口

导入类

头文件

说明

_Application

CApplicaton

Application.h

Excel应用程序。

Workbooks

CWorkbooks

Workbooks.h

工作簿的容器,里面包括了Excel应用程序打开的所有工作簿

_Workbook

CWorkbook

Workbook.h

单个工作簿。

Worksheets

CWorksheets

Worksheets.h

单个工作簿中的Sheet表格的容器,包括该工作簿中的所有Sheet

_Worksheet

CWorksheet

Worksheet.h

单个Sheet表格。

Range

CRange

Range.h

一定数量的单元格,可对单元格进行单个或多个单元格进行操作。

 

3、导入Excel的整个类型库

接口对应类只是对接口的属性和方法进行了封装,而Excel中的数据类型,如枚举类型却并为并不能使用,因此,为了更方便的操作Excel,还需要导入Excel的数据类型。

通过查看导入接口对应的头文件可以发现,在所有导入接口的头文件中,都会有这么行:

#import "D:\\Program Files\\Microsoft Office\\Office12\\EXCEL.EXE" no_namespace

这行代码的作用是导入Excel整个类型库到工程中。

VS2010自动产生的导入代码存在以下几个问题:

1)如果导入了多个接口,每个头文件都会把类型库导入一次,如果引用多个头文件,会导致类型库重复导入。

2Excel类型库中有些类型会跟MFC类库的某些类型冲突。

3Excel类型库的某些类型跟其他OfficeVB的某些库相关,如果不导入相关库,将导致这些类型无法使用。。

以上三点问题的解决方法如下:

1)仅在_Application接口对应头文件中导入Excel类型库。

2)对冲突的类型进行重命名。

3)在导入Excel类型库之前,先导入OfficeVB的相关库。

更改后的导入类型库的代码如下:

 

 

#import "C:\\Program Files\\Common Files\\Microsoft Shared\\OFFICE12\\MSO.DLL" \

rename("RGB", "MSORGB") \

rename("DocumentProperties", "MSODocumentProperties")

using namespace Office;

 

 

#import "C:\\Program Files\\Common Files\\Microsoft Shared\\VBA\\VBA6\\VBE6EXT.OLB"

using namespace VBIDE;

 

 

#import "D:\\Program Files\\Microsoft Office\\Office12\\EXCEL.EXE" \

rename("DialogBox", "ExcelDialogBox") \

rename("RGB", "ExcelRGB") \

rename("CopyFile", "ExcelCopyFile") \

rename("ReplaceText", "ExcelReplaceText") \

no_auto_exclude

Using namespace Excel;

 

编译程序后,会在DebugRelease目录下生成三个文件mso.tlhvbe6ext.tlhexcel.tlh。通过打开文件可知,该三个文件的命名空间分别是OfficeVBIDEExcel。导入了Excel的整个类型库后,就可以使用Excel中的所有类型了。

 

4、操作Excel步骤

操作Excel的主要步骤如下:

1)创建一个Excel应用程序。

2)得到Workbook的容器。

3)打开一个Workbook或者创建一个Workbook

4)得到Workbook中的Worksheet的容器。

5)打开一个Worksheet或者创建一个WorkSheet

6)通过RangeWorkSheet中的单元格进行读写操作。

7)保存Excel

8)释放资源。

 

5、批量处理Excel表格

VC通过OLE/COM操作Excel,是通过进程间的组件技术。因此,每次读写Excel中的单元格时,都要进行进程间的切换。当数据量大,如果一个单元格一个单元格的读取,主要的时间都花费在进程切换中。因此读取多个单元格,将可有效的提高程序的运行效率。

对多个单元格的读写操作可以通过CRange中以下两个成员函数来完成。

VARIANT get_Value2();

void put_Value2(VARIANT& newValue);

其中,输入参数newValue只要输入一个二维数组,即可实现向Excel中一次写入多个单元格的值。

其中,VARIANT中实现二维数据的方法可参考

http://www.cnblogs.com/xianyunhe/archive/2011/09/13/2174703.html

当然,在对CRange类进行操作之前,要设置CRange类对应的单元格。

 

6Excel表格的保存

1)如果要保存打开的工作簿,使用CWorkbook类的Save函数就可以保存工作簿,原文件将被覆盖。

2)如果是新创建的工作簿,或者是要另存为,可使用CWorkbook类的SaveAs函数。

SaveAs的参数比较多。其中,第1个参数是设置要保存文件的路径;第2个参数是设置文件的格式,可在MSDN中查看枚举类型XlFileFormat来了解Excel的文件格式。经过测试,在本文所用的测试环境中,Excel2003的文件格式是xlExcel8Excel2007的文件格式是xlExcel4

 

7、获取当前Excel的版本

可以通过CApplicationget_Version函数来获得Excel的版本,其中,Excel2007的主版本号是12Excel2003的主版本号是11

 

8、示例源代码

主要代码如下:

 

View Code
m_ListCtrl.SetExtendedStyle(LVS_REPORT | LVS_EX_FULLROWSELECT);

CApplication ExcelApp;
CWorkbooks books;
CWorkbook book;
CWorksheets sheets;
CWorksheet sheet;
CRange range;
LPDISPATCH lpDisp = NULL;

//创建Excel 服务器(启动Excel)
if(!ExcelApp.CreateDispatch(_T("Excel.Application"),NULL))
{
AfxMessageBox(_T("启动Excel服务器失败!"));
return -1;
}


CString strExcelVersion = ExcelApp.get_Version();
int iStart = 0;
strExcelVersion = strExcelVersion.Tokenize(_T("."), iStart);
if (_T("11") == strExcelVersion)
{
AfxMessageBox(_T("当前Excel的版本是2003。"));
}
else if (_T("12") == strExcelVersion)
{
AfxMessageBox(_T("当前Excel的版本是2007。"));
}
else
{
AfxMessageBox(_T("当前Excel的版本是其他版本。"));
}

ExcelApp.put_Visible(TRUE);
ExcelApp.put_UserControl(FALSE);


books.AttachDispatch(ExcelApp.get_Workbooks());


CString strBookPath = _T("C:\\tmp.xls");
try
{

lpDisp = books.Open(strBookPath, 
vtMissing, vtMissing, vtMissing, vtMissing, vtMissing,
vtMissing, vtMissing, vtMissing, vtMissing, vtMissing, 
vtMissing, vtMissing, vtMissing, vtMissing);
book.AttachDispatch(lpDisp);
}
catch(...)
{

lpDisp = books.Add(vtMissing);
book.AttachDispatch(lpDisp);
}



sheets.AttachDispatch(book.get_Sheets());


CString strSheetName = _T("NewSheet");
try
{

lpDisp = sheets.get_Item(_variant_t(strSheetName));
sheet.AttachDispatch(lpDisp);
}
catch(...)
{

lpDisp = sheets.Add(vtMissing, vtMissing, _variant_t((long)1), vtMissing);
sheet.AttachDispatch(lpDisp);
sheet.put_Name(strSheetName);
}

system("pause");


lpDisp = sheet.get_Range(_variant_t("A1"), _variant_t("J10"));
range.AttachDispatch(lpDisp);

VARTYPE vt = VT_I4; 
SAFEARRAYBOUND sabWrite[2]; 
sabWrite[0].cElements = 10;
sabWrite[0].lLbound = 0;
sabWrite[1].cElements = 10;
sabWrite[1].lLbound = 0;

COleSafeArray olesaWrite;
olesaWrite.Create(vt, sizeof(sabWrite)/sizeof(SAFEARRAYBOUND), sabWrite);


long (*pArray)[2] = NULL;
olesaWrite.AccessData((void **)&pArray);
memset(pArray, 0, sabWrite[0].cElements * sabWrite[1].cElements * sizeof(long));


olesaWrite.UnaccessData();
pArray = NULL;


long index[2] = {0, 0};
long lFirstLBound = 0;
long lFirstUBound = 0;
long lSecondLBound = 0;
long lSecondUBound = 0;
olesaWrite.GetLBound(1, &lFirstLBound);
olesaWrite.GetUBound(1, &lFirstUBound);
olesaWrite.GetLBound(2, &lSecondLBound);
olesaWrite.GetUBound(2, &lSecondUBound);
for (long i = lFirstLBound; i <= lFirstUBound; i++)
{
index[0] = i;
for (long j = lSecondLBound; j <= lSecondUBound; j++)
{
index[1] = j;
long lElement = i * sabWrite[1].cElements + j; 
olesaWrite.PutElement(index, &lElement);
}
}


VARIANT varWrite = (VARIANT)olesaWrite;
range.put_Value2(varWrite);

system("pause");


CString strSaveAsName = _T("C:\\new.xlsx");
CString strSuffix = strSaveAsName.Mid(strSaveAsName.ReverseFind(_T('.')));
XlFileFormat NewFileFormat = xlOpenXMLWorkbook;
if (0 == strSuffix.CompareNoCase(_T(".xls")))
{
NewFileFormat = xlExcel8;
}
book.SaveAs(_variant_t(strSaveAsName), _variant_t((long)NewFileFormat), vtMissing, vtMissing, vtMissing, 
vtMissing, 0, vtMissing, vtMissing, vtMissing, 
vtMissing, vtMissing);

system("pause");


VARIANT varRead = range.get_Value2();
COleSafeArray olesaRead(varRead);

VARIANT varItem;
CString strItem;
lFirstLBound = 0;
lFirstUBound = 0;
lSecondLBound = 0;
lSecondUBound = 0;
olesaRead.GetLBound(1, &lFirstLBound);
olesaRead.GetUBound(1, &lFirstUBound);
olesaRead.GetLBound(2, &lSecondLBound);
olesaRead.GetUBound(2, &lSecondUBound);
memset(index, 0, 2 * sizeof(long));
m_ListCtrl.InsertColumn(0, _T(""), 0, 100);
for (long j = lSecondLBound; j<= lSecondUBound; j++)
{
CString strColName = _T("");
strColName.Format(_T("%d"), j);
m_ListCtrl.InsertColumn(j, strColName, 0, 100);
}
for (long i = lFirstLBound; i <= lFirstUBound; i++)
{
CString strRowName = _T("");
strRowName.Format(_T("%d"), i);
m_ListCtrl.InsertItem(i-1, strRowName);

index[0] = i;
for (long j = lSecondLBound; j <= lSecondUBound; j++)
{
index[1] = j;
olesaRead.GetElement(index, &varItem);

switch (varItem.vt)
{
case VT_R8:
{
strItem.Format(_T("%d"), (int)varItem.dblVal);
}

case VT_BSTR:
{
strItem = varItem.bstrVal;
}

case VT_I4:
{
strItem.Format(_T("%ld"), (int)varItem.lVal);
}

default:
{

}
}

m_ListCtrl.SetItemText(i-1, j, strItem);
}
}




sheet.ReleaseDispatch();
sheets.ReleaseDispatch();
book.ReleaseDispatch();
books.ReleaseDispatch();
ExcelApp.Quit();
ExcelApp.ReleaseDispatch();

 

示例源代码的工程文件的下载链接如下:

https://files.cnblogs.com/xianyunhe/ReadWriteExcel.rar

 

参考资料

1http://www.cnblogs.com/xianyunhe/archive/2011/09/13/2174703.html

2http://hfp0601.blog.163.com/blog/static/228483522011031104718762/

3http://www.cppblog.com/sleepwom/archive/2009/10/03/97804.html

4http://www.rondebruin.nl/saveas.htm

----------------------------------------------------------------------------------------------------------------

[转]VS2010+MFC解析Excel文件中数据

本文转自:http://www.vcfans.com/2010/08/vs2010-mfc-excel-file-in-the-data-analysis.html

 

前两天折腾一个小功能,需求是解析Excel中的数据出来。网上一般使用的方案:
1. ODBC当数据库来操作。
2. 使用第三方的类库
3. 使用COM调用Excel.exe中的接口。

第三方类库我怕MS升级版本后,是否仍然使用是个问号。使用ODBC的方案感觉很怪怪的,但据说不能修改删除什么的,不过我没有试验,还是放弃此种方案。我最终还是使用COM来做的,本来是没什么实现代码,都是COM实现好的,没什么可写的。难点在于VS2010的版本与MSDN上的说法严重不一致,折腾死人。MSDN上说的方案是VC6.0的实现方法。而且加入COM后与VS的SDK库冲突,无法编译。下面说说我的使用方法。

第一步:初化COM接口。在InitInstance中加入如下代码:

1
2
3
4
5
if(!AfxOleInit())
	{
		AfxMessageBox(_T( "Cannot initialize COM dll" ));
		return FALSE;
	}

第二步:向工程添加Excel的C++操作类。具体步骤见下图:
1.Ctrl+Shift+X 打开类向导。

2.添加“类型库中MFC类”。此处操作与VC6.0有很大的不一样,让我找了半天,如下图:

3.添加需要的类文件。如下图:

4.将刚才导入的类头文件,加到模块中。

1
2
3
4
5
6
#include "CApplication.h"
#include "CWorkbooks.h"
#include "CWorksheets.h"
#include "CWorkbook.h"
#include "CWorksheet.h"
#include "CRange.h"

到此好像一切都结束了,下面就是写调用上面载入的代码了。But……,当你编译时。MS将给你如下惊喜:

1>d:\xls\xls\debug\excel.tlh(74974): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(74974): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(74974): warning C4183: “GetMailEnvelope”: 缺少返回类型;假定为返回“int”的成员函数
1>d:\xls\xls\debug\excel.tlh(75683): error C2146: 语法错误: 缺少“;”(在标识符“HTMLProject”的前面)
1>d:\xls\xls\debug\excel.tlh(75683): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75683): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75693): error C2146: 语法错误: 缺少“;”(在标识符“CommandBars”的前面)
1>d:\xls\xls\debug\excel.tlh(75693): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75693): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75737): error C2146: 语法错误: 缺少“;”(在标识符“VBProject”的前面)
1>d:\xls\xls\debug\excel.tlh(75737): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75737): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75739): error C2146: 语法错误: 缺少“;”(在标识符“Permission”的前面)
1>d:\xls\xls\debug\excel.tlh(75739): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75739): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75741): error C2146: 语法错误: 缺少“;”(在标识符“SharedWorkspace”的前面)
1>d:\xls\xls\debug\excel.tlh(75741): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75741): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75743): error C2146: 语法错误: 缺少“;”(在标识符“Sync”的前面)
1>d:\xls\xls\debug\excel.tlh(75743): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75743): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75757): error C2146: 语法错误: 缺少“;”(在标识符“SmartDocument”的前面)
1>d:\xls\xls\debug\excel.tlh(75757): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75757): error C4430: 缺少类型说明符 – 假定为 int。注意: C++ 不支持默认 int
1>d:\xls\xls\debug\excel.tlh(75759): error C2146: 语法错误: 缺少“;”(在标识符“DocumentLibraryVersions”的前面)
1>d:\xls\xls\debug\excel.tlh(75759): fatal error C1003: 错误计数超过 100;正在停止编译
========== 生成: 成功 0 个,失败 1 个,最新 0 个,跳过 0 个 ==========

我也不知道为什么造成这种结果,可能是由于这类接口是MS在N年前就弄好,后来VS升级了,相关接口也就年久失修了。造成我们这帮使用老技术的人的尴尬,后来求助于万能的Google大侠,得到如下方案:

将刚才导入的几个头文件中的:

1
#import "D:\\Program Files\\Microsoft Office\\Office12\\EXCEL.EXE" no_namespace

替换成:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#pragma region Import the type libraries
 
#import "libid:2DF8D04C-5BFA-101B-BDE5-00AA0044DE52" \
	rename("RGB", "MSORGB") \
	rename("DocumentProperties", "MSODocumentProperties")
// [-or-]
//#import "C:\\Program Files\\Common Files\\Microsoft Shared\\OFFICE12\\MSO.DLL" \
//	rename("RGB", "MSORGB") \
//	rename("DocumentProperties", "MSODocumentProperties")
 
using namespace Office;
 
#import "libid:0002E157-0000-0000-C000-000000000046"
// [-or-]
//#import "C:\\Program Files\\Common Files\\Microsoft Shared\\VBA\\VBA6\\VBE6EXT.OLB"
 
using namespace VBIDE;
 
#import "libid:00020813-0000-0000-C000-000000000046" \
	rename("DialogBox", "ExcelDialogBox") \
	rename("RGB", "ExcelRGB") \
	rename("CopyFile", "ExcelCopyFile") \
	rename("ReplaceText", "ExcelReplaceText") \
	no_auto_exclude
// [-or-]
//#import "C:\\Program Files\\Microsoft Office\\Office12\\EXCEL.EXE" \
//	rename("DialogBox", "ExcelDialogBox") \
//	rename("RGB", "ExcelRGB") \
//	rename("CopyFile", "ExcelCopyFile") \
//	rename("ReplaceText", "ExcelReplaceText") \
//	no_auto_exclude
 
#pragma endregion

到此搞定环境问题,下面就根据需求对Excel进行操作吧。

有图有真像:

----------------------------------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------------------------------

posted @ 2016-10-25 14:46  $JackChen  阅读(597)  评论(0编辑  收藏  举报