摘要: 题目大意: 有标签式的数据描述,每组数据由<case> </case>标签隔开。 每组数据中有若干个<page></page>隔开的页面描述,每个page中<url> </url>之间是这个page的url地址,<text></text>之间是正文,保证正文每个单词用空格隔开,没有标点,每个正文最多512个词,每个page中还有<link></link>标记的链接描述,<link></link>之间可能出现别的页面的url,在别的页面中外部链接中出现的 阅读全文
posted @ 2012-07-24 20:58 Ijingo 阅读(245) 评论(0) 推荐(0) 编辑