2012年11月6日

Daily scrum 11.6

摘要: 今日任务统计:燃尽图:张永强同学的处理html并提取数据的代码:using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;using commons;using HtmlAgilityPack;using System.IO;namespace HTMLParser{ public class HTMLParser : IHtmlParser { CommonPageInfo page; Ht... 阅读全文

posted @ 2012-11-06 23:22 fightingsnail1 阅读(240) 评论(1) 推荐(0) 编辑

技术说明文档——Content schema definition &Content Pipeline

摘要: 1 Goals定义这个网站需要的内容结构, 并从爬到的内容中抽取元数据 (meta data), 并支持标签, 翻译等功能。2 Design Principles 1) 最小复杂度:因该做出简易的且易于理解的设计 2) 易于维护:在做工作的时候就要为维护的人员着想 3) 可扩展性:可以无需破坏底层的结构而增强功能 4) 可移植性 5) 精简性:意味着设计出的系统没有多余的无用的部分。 6) 层次性:保持系统各个分解层的层次性,使我们能在任意层次上观察系统,并得到一直的看法 7) 使用标准技术:尽量用标准化的东西,常用的方法让整... 阅读全文

posted @ 2012-11-06 09:34 fightingsnail1 阅读(393) 评论(3) 推荐(0) 编辑

导航