Visual C#2005——如何解析含有多种格式的文本文件

一般而言,文本文件都只包含一格式(例如,以逗分隔或是固定字段),然而文本文件却很可能含有多格式,遇到此种状况时该如何理呢?

 

 

如果的文本文件含有多格式,应该使用TextFieldParser象的PeekChars方法去取得据行从头算起特定目的字符,以便藉此断该数据行的格式,然后告知TextFieldParser该数据行的格式并读该数据行。PeekChars方法只返回指定目的字符而且不至下一行,通过这样逐一判每一笔数据行的格式逐行据行的方式,即可解析含有多格式的文字文件并顺取。

 

来说,假用程序目的Text文件含有一称为“多格式文本文件.txt”的文本文件,此文本文件的特殊之在于含有下列三格式:

 

Ø        固定字段度分别为510 -1据行。

Ø        固定字段度分别为61017 -1据行。

Ø        采用逗分隔的据行。

 

上述格式的据行存在一特点,就是据行的开头字符分CKPBSP,因此我只要通TextFieldParser象的PeekChars方法取得据行的前两个字符,然后根据其值来设TextFieldType性,以及Delimiters性(或SetDelimiters方法)或FieldWidths性(或SetFieldWidths方法),使用ReadFields方法来读据行。反使用此方式来处理每一笔数据行,就能够顺利解析并读取整文本文件。

 

以下的程序代示范如何“多格式文本文件.txt”中的三格式据解析出来并别显示于各自的DataGridView控件中。相程序代列示如下:

 

private void CH1_DemoForm035_Load(object sender, EventArgs e)
  {
      txtResult.Text = File.ReadAllText(@"Text\多格式文本文件.txt");

      DataGridView1.ColumnHeadersVisible = true;

      // 设定栏标题样式。
      DataGridViewCellStyle columnHeaderStyle = new DataGridViewCellStyle();

      columnHeaderStyle.BackColor = Color.Beige;
      columnHeaderStyle.Font = new Font("Verdana", 9, FontStyle.Bold);
      DataGridView1.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      // 设定 DataGridView 控件的数据行数目。
      DataGridView1.ColumnCount = 3;

      // 设定各数据行的标题名称。
      DataGridView1.Columns[0].Name = "类别编号";
      DataGridView1.Columns[1].Name = "类别名称";
      DataGridView1.Columns[2].Name = "说明";

      DataGridView1.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

      DataGridView2.ColumnHeadersVisible = true;
      DataGridView2.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      // 设定 DataGridView 控件的数据行数目。
      DataGridView2.ColumnCount = 4;

      // 设定各数据行的标题名称。
      DataGridView2.Columns[0].Name = "产品编号";
      DataGridView2.Columns[1].Name = "产品名称";
      DataGridView2.Columns[2].Name = "单位数量";
      DataGridView2.Columns[3].Name = "单价";

      DataGridView2.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

      DataGridView3.ColumnHeadersVisible = true;
      DataGridView3.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      // 设定 DataGridView 控件的数据行数目。
      DataGridView3.ColumnCount = 3;

 

      // 设定各数据行的标题名称。
      DataGridView3.Columns[0].Name = "货运公司编号";
      DataGridView3.Columns[1].Name = "货运公司名称";
      DataGridView3.Columns[2].Name = "电话";

      DataGridView3.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

  }

  private void btnParseTextFiles_Click(object sender, EventArgs e)
  {
      using (TextFieldParser myReader =

                      new TextFieldParser(@"Text\多格式文本文件.txt"))
      {
          // 定义三种格式之各栏的宽度与分隔字符。
          int[] FirstFormat = { 5, 10, -1 };
          int[] SecondFormat = { 6, 10, 17, -1 };
          string[] ThirdFormat = { "," };

          this.DataGridView1.Rows.Clear();
          this.DataGridView2.Rows.Clear();
          this.DataGridView3.Rows.Clear();

          string[] CurrentRow;

          while (!myReader.EndOfData)
          {
              try
              {
                  string RowType = myReader.PeekChars(2);

                  switch (RowType)
                  {
                      case "CK":
                          myReader.TextFieldType = FieldType.FixedWidth;
                          myReader.FieldWidths = FirstFormat;
                          // 或是myReader.SetFieldWidths(FirstFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView1.Rows.Add(CurrentRow);
                          break;
                      case "PB":
                          myReader.TextFieldType = FieldType.FixedWidth;
                          myReader.FieldWidths = SecondFormat;
                          // 或是myReader.SetFieldWidths(SecondFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView2.Rows.Add(CurrentRow);
                          break;
                      case "SP":
                          myReader.TextFieldType = FieldType.Delimited;
                          myReader.Delimiters = ThirdFormat;
                          // 或是myReader.SetDelimiters(ThirdFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView3.Rows.Add(CurrentRow);
                          break;
                  }
              }
              catch (MalformedLineException ex)
              {
                  MessageBox.Show("" + ex.Message + " 是无效的。略过。");
              }
          }

          // 排序各个 DataGridView 控件的内容。
          DataGridView1.Sort(DataGridView1.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
          DataGridView2.Sort(DataGridView2.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
          DataGridView3.Sort(DataGridView3.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
      }
  }

 

请注意:

在使用Visual BasicMy对象(或是说My快捷方式)之前,必须先在项目中添加对Microsoft.VisualBasic.dll的引用,然后如下所示导入适当的命名空间:

 

using Microsoft.VisualBasic.Devices;

 

如此一来,就可以在Visual C# 中使用与My相似的语法来撰写程序。

 

章立民研究室敬上

期待更多精彩,敬请关注:

http://www.china-pub.com/static/jsj_zlm_060824.html

 

 

posted on 2006-09-28 09:26  章立民研究室  阅读(3742)  评论(1编辑  收藏  举报

导航