用VC#2005解析含有多种格式的文本文件
一般而言,文本文件都只会包含一种格式(例如,以逗号分隔或是固定字段宽度),然而文本文件却很可能含有多种格式,当遇到此种状况时该如何处理呢?
如果您的文本文件含有多种格式,应该使用TextFieldParser对象的PeekChars方法去取得数据行从头算起特定数目的字符,以便藉此来判断该数据行的格式,然后告知TextFieldParser对象该数据行的格式为何并读取该数据行。PeekChars方法只会返回指定数目的字符而且不会前进至下一行,通过这样逐一判别每一笔数据行的格式并逐行读取数据行的方式,即可够解析含有多种格式的文字文件并顺利读取。
举例来说,假设我们在应用程序项目的Text文件夹含有一个名称为“多格式文本文件.txt”的文本文件,此文本文件的特殊之处在于它含有下列三种格式:
·固定字段宽度分别为5、10与 -1的数据行。
·固定字段宽度分别为6、10、17与 -1的数据行。
·采用逗号分隔的数据行。
上述这三种格式的数据行存在一个特点,就是数据行的开头字符分别是CK、PB与SP,因此我们只要通过TextFieldParser对象的PeekChars方法取得数据行的前两个字符,然后根据其值来设定TextFieldType属性,以及设定Delimiters属性(或调用SetDelimiters方法)或FieldWidths属性(或调用SetFieldWidths方法),并使用ReadFields方法来读取数据行。反复使用此方式来处理每一笔数据行,就能够顺利解析并读取整个文本文件。
以下的程序代码示范如何将“多格式文本文件.txt”中的三种格式数据解析出来并分别显示于各自的DataGridView控件中。相关程序代码列示如下:
请注意:
在使用Visual Basic的My对象(或是说My快捷方式)之前,必须先在项目中添加对Microsoft.VisualBasic.dll的引用,然后如下所示导入适当的命名空间:
using Microsoft.VisualBasic.Devices;
如此一来,就可以在Visual C# 中使用与My相似的语法来撰写程序。
如果您的文本文件含有多种格式,应该使用TextFieldParser对象的PeekChars方法去取得数据行从头算起特定数目的字符,以便藉此来判断该数据行的格式,然后告知TextFieldParser对象该数据行的格式为何并读取该数据行。PeekChars方法只会返回指定数目的字符而且不会前进至下一行,通过这样逐一判别每一笔数据行的格式并逐行读取数据行的方式,即可够解析含有多种格式的文字文件并顺利读取。
举例来说,假设我们在应用程序项目的Text文件夹含有一个名称为“多格式文本文件.txt”的文本文件,此文本文件的特殊之处在于它含有下列三种格式:
·固定字段宽度分别为5、10与 -1的数据行。
·固定字段宽度分别为6、10、17与 -1的数据行。
·采用逗号分隔的数据行。
上述这三种格式的数据行存在一个特点,就是数据行的开头字符分别是CK、PB与SP,因此我们只要通过TextFieldParser对象的PeekChars方法取得数据行的前两个字符,然后根据其值来设定TextFieldType属性,以及设定Delimiters属性(或调用SetDelimiters方法)或FieldWidths属性(或调用SetFieldWidths方法),并使用ReadFields方法来读取数据行。反复使用此方式来处理每一笔数据行,就能够顺利解析并读取整个文本文件。
以下的程序代码示范如何将“多格式文本文件.txt”中的三种格式数据解析出来并分别显示于各自的DataGridView控件中。相关程序代码列示如下:
private void CH1_DemoForm035_Load(object sender, EventArgs e) { txtResult.Text = File.ReadAllText(@"Text\多格式文本文件.txt"); DataGridView1.ColumnHeadersVisible = true; // 设定栏标题样式。 DataGridViewCellStyle columnHeaderStyle = new DataGridViewCellStyle(); columnHeaderStyle.BackColor = Color.Beige; columnHeaderStyle.Font = new Font("Verdana", 9, FontStyle.Bold); DataGridView1.ColumnHeadersDefaultCellStyle = columnHeaderStyle; // 设定 DataGridView 控件的数据行数目。 DataGridView1.ColumnCount = 3; // 设定各数据行的标题名称。 DataGridView1.Columns[0].Name = "类别编号"; DataGridView1.Columns[1].Name = "类别名称"; DataGridView1.Columns[2].Name = "说明"; DataGridView1.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells; DataGridView2.ColumnHeadersVisible = true; DataGridView2.ColumnHeadersDefaultCellStyle = columnHeaderStyle; // 设定 DataGridView 控件的数据行数目。 DataGridView2.ColumnCount = 4; // 设定各数据行的标题名称。 DataGridView2.Columns[0].Name = "产品编号"; DataGridView2.Columns[1].Name = "产品名称"; DataGridView2.Columns[2].Name = "单位数量"; DataGridView2.Columns[3].Name = "单价"; DataGridView2.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells; DataGridView3.ColumnHeadersVisible = true; DataGridView3.ColumnHeadersDefaultCellStyle = columnHeaderStyle; // 设定 DataGridView 控件的数据行数目。 DataGridView3.ColumnCount = 3; // 设定各数据行的标题名称。 DataGridView3.Columns[0].Name = "货运公司编号"; DataGridView3.Columns[1].Name = "货运公司名称"; DataGridView3.Columns[2].Name = "电话"; DataGridView3.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells; } private void btnParseTextFiles_Click(object sender, EventArgs e) { using (TextFieldParser myReader =new TextFieldParser(@"Text\多格式文本文件.txt")) { // 定义三种格式之各栏的宽度与分隔字符。 int[] FirstFormat = { 5, 10, -1 }; int[] SecondFormat = { 6, 10, 17, -1 }; string[] ThirdFormat = { "," }; this.DataGridView1.Rows.Clear(); this.DataGridView2.Rows.Clear(); this.DataGridView3.Rows.Clear(); string[] CurrentRow; while (!myReader.EndOfData) { try { string RowType = myReader.PeekChars(2); switch (RowType) { case "CK": myReader.TextFieldType = FieldType.FixedWidth; myReader.FieldWidths = FirstFormat; // 或是myReader.SetFieldWidths(FirstFormat); CurrentRow = myReader.ReadFields(); this.DataGridView1.Rows.Add(CurrentRow); break; case "PB": myReader.TextFieldType = FieldType.FixedWidth; myReader.FieldWidths = SecondFormat; // 或是myReader.SetFieldWidths(SecondFormat); CurrentRow = myReader.ReadFields(); this.DataGridView2.Rows.Add(CurrentRow); break; case "SP": myReader.TextFieldType = FieldType.Delimited; myReader.Delimiters = ThirdFormat; // 或是myReader.SetDelimiters(ThirdFormat); CurrentRow = myReader.ReadFields(); this.DataGridView3.Rows.Add(CurrentRow); break; } } catch (MalformedLineException ex) { MessageBox.Show("行" + ex.Message + " 是无效的。略过。"); } } // 排序各个 DataGridView 控件的内容。 DataGridView1.Sort(DataGridView1.Columns[0], System.ComponentModel.ListSortDirection.Ascending); DataGridView2.Sort(DataGridView2.Columns[0], System.ComponentModel.ListSortDirection.Ascending); DataGridView3.Sort(DataGridView3.Columns[0], System.ComponentModel.ListSortDirection.Ascending); } } |
请注意:
在使用Visual Basic的My对象(或是说My快捷方式)之前,必须先在项目中添加对Microsoft.VisualBasic.dll的引用,然后如下所示导入适当的命名空间:
using Microsoft.VisualBasic.Devices;
如此一来,就可以在Visual C# 中使用与My相似的语法来撰写程序。