摘要: 今天公司的项目中代码中被同事发现一个bug,是一个url相对路径转换为绝对路径函数里的问题。之前直接copy了开源项目crawler里的NormalizeLink()函数,这个函数内部也是利用.net frameword 中的Uri类进行处理的,多了几步判断处理。不过当url参数中含有已经经过urlencode处理的字符时,结果就会出现乱码。猜测Uri内部对url 进行了urldecode处理,而urldecode的encoding与之前urlencode的encoding不同,所以导致乱码。在reflector粗略看了下Uri的源码发现实现有点复杂,也就没继续了。呵呵,在面对复杂的不规范的w 阅读全文
posted @ 2012-02-23 01:44 花生!~~ 阅读(436) 评论(0) 推荐(0) 编辑