摘要: 题目描述Baidu的服务器上使用的不是北京时间,而是Baidu时间。Baidu时间的时分秒与北京时间相同,但是日期与北京时间不同,是用一个正整数表示从2000年1月1日起的第几天。现在就请大家设计一个程序将北京时间转换为百度时间。输入格式输入数据的每一行为一个待转化的北京时间,格式包括两种:一种为:YYYY-MM-DD,(YYYY表示四位数年份,MM为两位月份,DD为两位日期);另一种为:MM/DD/YYYY,(YYYY表示四位数年份,MM为两位月份,DD为两位日期);不符合任何一种格式的输入视为非法输入。输出格式每个数据输出一行。如果格式正确,输出一个正整数,否则输出Error。输入样例20 阅读全文
posted @ 2012-05-20 13:05 windmissing 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 题目描述百度网页采集器(Baiduspider)每天从互联网收录数亿网页,互联网的网页质量参差不齐。百度的工程师们每天都在改进方法来判断一个网页质量的好坏,使质量差的网页出现在检索结果中较后的位置。现在实习生小胖想到一个很简单的方法来判断一个网页内容的好坏,方法如下:1.利用数据挖掘技术在互联网语料库中挖掘出一批有特点的词汇,分为好词和坏词两种,好词标上正的权重,坏词标上负的权重;2.通过好词和坏词词典对每个网页计算网页总权重:从第一个字开始匹配,找到一个好词则加上相应的权重,找到一个坏词则减去相应的权重,下一次匹配将从找到的词末尾的下一个位置开始。3.坏词采用正向最短匹配:从当前匹配位置开始 阅读全文
posted @ 2012-05-20 10:50 windmissing 阅读(131) 评论(0) 推荐(0) 编辑