作为.Net实习生在最初2周所学到的一些经验和小结,EnterpriseLibrary,Regex,HttpWebRequest

很幸运一个实习生能用到Dell 的WorkStation做开发机,Xeon4核(或许是双cpu+超线程),双SCSI硬盘,呵呵。
只能说现在的东家给自己提供了非常完美的硬件和软件环境,就看自己能怎么好好把握了。
记录下一些学习点滴:

在这边实习所要做的真正项目尚未启动,所以这段时间干的活都是些为商务数据挖掘分析做支持。除此之外就是自己找资料学习,并且巩固c#,.net的基础知识。
boss起初给自己布置的任务是,熟悉一下Enterprise Library的LogModule, 这个library在微软官方网站上能下载到,并有官方文档。看起来有点累,后来找到了http://wiki.entlib.net.cn/,一个很不错的.net WIKI,进行着好几个项目,大牛的博客中文版,重要非ms官方.net组件的文档中文化工作等等。还有就是园子里的TerryLee的博客,有很多都是介绍EntLib的东西,貌似4.0就快要发布了。http://terrylee.cnblogs.com/ 
http://msdn2.microsoft.com/zh-cn/practices/default.aspx  微软的Patterns&Practices工作组负责的这些项目。
我发现,如果英文牛b了,越过中美海底光缆能查阅到数不清的好学习材料和参考资料。

正则表达式RegularExpression
在公司里实习的这阶段主要工作是为公司需要的一些数据在网上进行抓取。第一个接触的case是建立一个火车班次的数据库表,拿到一串班次列表,找到一个能在线查询的网站,这就是已知条件。问题在于自己还没用过正则表达式,如何在HTML页面中找出我们所需要的信息是个问题。好在第一次干活,正则是boss给我写的。于是乎开始学习RegularExpression,一个工作日,做到这类抓取工作能自己独立完成。

http://dragon.cnblogs.com/archive/2006/05/08/394078.html 深入浅出之正则表达式
http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm 正则表达式30分钟入门教程
写的非常好的两篇教程,对正则这个东西本身有所了解之后,就要学会如何在c# .net中使用。这个靠MSDN就能完成。

在初学的时候可能会产生疑惑的是关于Regex的MatchCollection和Groups概念了。一个传入的string中可能会有好几块是能够匹配我们的正则表达式了,于是这些块就组成了MatchCollection,每一个成为一个Match,按照次序从MatchCollection的[0]下标开始。
我们的正则表达式中有些内容会用括号(...)括起来,一般来说整个正则负责找到我们要的语段,然后括号里的内容则是具体我们所需要具体字段。而这些Groups的内容就是对应这些括号的次序了。值得注意的是Groups[0]代表了这个所在Match,真正我们想要的内容,第x个括号就是Groups[x],不是通常的从下标0开始。

关于抓取网页的HTML内容
本来自己是不会这个的,在boss的指引下,自己写了一个简单的Class,总之使用的是 System.Net.HttpWebRequest,和 HttpWebResponse进行http方面的请求和响应操作。
 http://www.cnblogs.com/flyshufeman/archive/2008/02/26/1081957.html 整理了一下Class,还有待完善。

还有一些关于在公司里为人处事的经验
毕竟自己还是个实习生,工作压力和难度和其他正职员工和自己boss还是有很大差距的。虽说实习生都是带出来的,但是老有不大不小的问题去占用boss的时间实在不是良久之策。公司里同事们都坐的不远,基本大声说话都能听得见,但是内部公文形式的Outlook还是非常有用的。因为邮件能保存,不会打扰到正常工作,能做标记,很多时候不是很紧急的情况下用Email进行提问是非常有必要的。
不要浪费午饭时间。平时大家都很忙,或许没有什么机会进行交流。吃午饭的时候大家都闲了下来,公司里有食堂帮,哈哈,去食堂的路上什么话题都能聊,什么问题都能问。要相信周围这个团队都是十分优秀的人,并要牢记正是因为自己足够优秀才能到这里来实习,而已经在这里工作的人们,自然能教会自己更多东西。

给自己的导师做选择题比做问答题要好得多
虽说人家作为你的导师有义务带你,但是如果有问题之后自己能多些思考,在自己考虑了几套执行方案之后再向上边发问,然后让boss提供一些建议性质的指导是非常有必要的。去实习着重的还是自己本身的学习和完成实习工作的平衡,总是自己不思考如何才能学的更加扎实?
posted @ 2008-02-26 12:59  BetaGeek™  阅读(618)  评论(6编辑  收藏  举报