SUMTEC -- There's a thing in my bloglet.

But it's not only one. It's many. It's the same as other things but it exactly likes nothing else...

:: :: :: :: :: ::

:: ::

263 随笔 :: 19 文章 :: 3009 评论 :: 74万阅读

2025年3月

日

一

二

三

四

五

六

公告

刚开一店，卖本人股票公式所产生的图。目前正在beta测试，只要是博客园的都可以参加。购买地址在这里。

山不在高，有仙则名。水不在深，有龙则灵。斯是陋室，唯吾德馨。苔痕上阶绿，草色入帘青。谈笑有鸿儒，往来无白丁。可以调素琴，阅金经。无丝竹之乱耳，无案牍之劳形。南阳诸葛庐，西蜀子云亭。
子曰∶“何陋之有？”

My doggie BEN said:
Smiling is a good beginning of a wonderful day.

昵称： Sumtec
园龄： 20年10个月
粉丝： 168
关注： 4

+加关注

随笔档案 (260)

相册 (22)

Blog sitex

Blogx (.NET CF)

Blogx (.NET)

Game Dev

.GAME Framework

大杂烩

最新评论

1. Re:博客园的首页
11
--等等小九吧717
2. Re:字符串多模式精确匹配（脏字/敏感词汇/关键字过滤算法）——TTMP算法之实战F模式
这个项目已经很强大了。过滤效率是正则的1.5万倍，
--ToolGood
3. Re:C#本地变量声明趣味解析
@ Sumtec可能我现在层级不够吧，等我以后弄懂了整体运行机制吧，谢谢楼主给我讲这些，我只是猜测会不会是所有的声明变量是在一起实现的，没有觉得代码顺序会随便交换。...
--自强不息的sun
4. Re:C#本地变量声明趣味解析
@ 自强不息的sun第一，你没有懂我在说什么；第二，你也没有彻底理解书里面说的是什么。首先，我说的是子作用域会影响该作用域结束之后的父作用域的变量命名，在子作用域之后即便回到父作用域，也不能再次声明同...
--Sumtec
5. Re:C#本地变量声明趣味解析
编译器眼里，至少在方法外边去写，随便在上面还是下面，函数内部都能够直接使用这个变量a。也许它对于函数内部的变量解析用的是相同的原理呢？在子级上面和在子级下面如果和上面两张图采用的相同对待就不难解释了吧...
--自强不息的sun

继续：.NET CF下面“大”规模数据的读取和保存

上一个Post讲到，在.NET CF下面直接用XmlDocument来读取比较大的Xml文件是非常缓慢的，但是我们也只是知道了一个绝对值，没有参照物，还是不知道到底怎么样。其实利用上一个Post的代码，读取同样格式和内容的Xml文件，当Item数量在接近6000的时候，仅仅是遍历一次所有的内容，仍然将会花费50秒左右的时间。注意这里仅仅是遍历，没有其他多余的语句，例如将数据用某种类型结构保存在内存当中等等。当然，这比197秒要好多了，但是这仍然不能够满足我们的需求。在跟进一步的提高速度之前，还是先尝试粗略分析一下性能的瓶颈在哪里。

用Reflector分析一下Xml相关的各个类，我们会发现XmlDocument实际上是利用XmlReader来解析Xml文件的，同时还会同时构造每一个节点，比如XmlElement或者XmlAttribute。很明显XmlDocument肯定不会比XmlReader更加有效率，至少XmlDocument还需要构造一系列的对象，并且还是递归的。如果我们能够减少节点的层次，或者尽量封闭节点（使之不具备拥有子节点的资格，例如把XmlElement的数据挪到XmlAttribute里面），那么XmlDocument的效率会有一定层次的提高。如果说数据量不是非常大（大概100左右），不希望用复杂的方式来完成本来应该很简单的事情，那么这个方法也值得尝试。

<Root>

<Item id = "2" name = "world" something = "zzz" type = "reference" extension = "123">China</Item>

……

</Root>

不过我们也可以预见这个提高的程度是相当有限的，甚至不如分割文件所带来的效率。除了可能不雅观这个不充足的理由之外，如果我们需要对something用一个Attribute来额外描述的时候，这个方法就部分的失效了。当我看了一遍Xml里面的相关代码后，并没有完全搞清楚里面的机制，但是有一点是肯定的——代码复杂，从XmlDocument到XmlReader都是复杂的代码，几乎没有一目了然的东西。不过在这个复杂的背后，其实有着一定的效率优化，这在后面的实验结果里面可以看出来，但是我却暂时无法从.NET CF里面的代码直接分析出来，到底是哪个部分的性能优化带来了这些性能提升。

有的时候我们也需不愿意，或者无法进行文件分割，比如说所有的数据都必须要加载了才能够计算，又或者我们不能够冒分割文件所带来的一些技术风险，那么也许我们需要考虑用自己的文件格式来保存了，比如说二进制（也许文本方式也是一个不错的选择，我说的是纯文本）。如果您同意了我这个假设成立，那么我们可以开始着手研究一下有关文件读取方面的问题。不要以为这是一个简单的问题，我之前也以为这是一个很简单的问题，而最后我却发现这个问题要看硬件平台如何。我一年前在PC上面做应用，感觉文件读取和内存读取效率相差不大。当时我就猜测由于PDA的文件在内存当中，因此不会像桌面PC一样，文件的读取效率和内存的读取效率相差上千倍，顶多相差十倍。而当时的工作经验告诉我似乎结果就是这样的，因为我在PDA上面读取文件几乎就没有遇到什么性能瓶颈。然而这一次在SmartPhone上面的情况却完全不一样，让我大吃一惊。如果有机会大家可以在SmartPhone上面运行一下如下的代码片断，保证有一个深刻的体会：

void Test()

{

// Create an 1MB file for testing, make the buffer size of filestream object to 640k

FileStream fs = new FileStream(

"Test.Binary",

FileMode.Create,

FileAccess.ReadWrite,

FileShare.None,

655360

);

byte[] buff = new byte[1048576];

fs.Write(buff, 0, buff.Length);

long ticks;

// Reset the position

fs.Position = 0;

BinaryReader br = new BinaryReader(fs);

// Test reading every byte from BinaryReader using for statement:

ticks = DateTime.Now.Ticks;

for(i = 0; i < buff.Length; i++)

{

br.ReadByte();

}

ticks = DateTime.Now.Ticks - ticks;

MessageBox.Show(ticks.ToString());

// Reset the position and test reading every byte using while statement:

fs.Position = 0;

ticks = DateTime.Now.Ticks;

while (fs.Position != fs.Length)

{

br.ReadByte();

}

ticks = DateTime.Now.Ticks - ticks;

MessageBox.Show(ticks.ToString());

// Reset the position and test reading via MemoryStream

// using while statement:

fs.Position = 0;

ticks = DateTime.Now.Ticks;

// we define another buffer to test mem alloc time all together

byte[] buffRead = new byte[buff.Length];

fs.Read(buffRead, 0, buffRead.Length);

MemoryStream ms = new MemoryStream(buffRead);

br = new BinaryReader(ms);

while (ms.Position != ms.Length)

{

br.ReadByte();

}

ticks = DateTime.Now.Ticks - ticks;

MessageBox.Show(ticks.ToString());

fs.Close();

}

待续……

posted on 2004-10-23 00:25 Sumtec 阅读(1093) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库，助力快速实现文件压缩解压功能！
· Ollama——大语言模型本地部署的极速利器

点击右上角即可分享

SUMTEC -- There's a thing in my bloglet.

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (285)

随笔档案 (260)

文章分类 (22)

相册 (22)

Blog sitex

Blogx (.NET CF)

Blogx (.NET)

Game Dev

大杂烩

阅读排行榜

评论排行榜

推荐排行榜

最新评论