7-18(查找) 新浪微博热门话题(30 分)
新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:
输入说明:输入首先给出一个正整数N(≤105),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#
中的内容均被认为是一个话题,如果长度超过40个字符,则只保留前40个字符。输入保证#
成对出现。
输出格式:
第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more ...
,其中k
是另外几条热门话题的条数。输入保证至少存在一条话题。
注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。
输入样例:
4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
输出样例:
Hot 2 And 1 more ...
刚开始没有思路,网上了解了一下题意后,感觉这题不难,代码:
#include<iostream> #include<map> #include<cstdio> #include<vector> #include<cstring> #include<algorithm> #include<cctype> using namespace std; string trans(string s){ string ss; for(int i=0;i<s.size();i++){ if(s[i]>='A'&&s[i]<='Z')s[i]=tolower(s[i]); else if(s[i]>='a'&&s[i]<='z'||s[i]>='0'&&s[i]<='9')s[i]=s[i]; else s[i]=' '; } if(s[0]==' ')for(int i=1;i<s.size();i++) ss.push_back(s[i]); else if(s[(s.size()-1)]==' ')for(int i=0;i<s.size()-1;i++)ss.push_back(s[i]); else ss=s; return ss; } int main(){ int n; char st[1000]; vector<int> v; map<string ,int > flag; map<string ,int > m; cin>>n;getchar(); for(int i=0;i<n;i++){ flag.clear(); gets(st); string s=st; v.clear(); for(int i=0;s[i];i++){ if(s[i]=='#') v.push_back(i); } while(v.size()){ int a=v.front(); v.erase(v.begin()); int b=v.front(); v.erase(v.begin()); string s1=s.substr(a+1,b-a-1); string s2= trans(s1);//cout<<endl<<s2<<"$$$$$$$$"<<endl; s2[0]=toupper(s2[0]); if(!flag[s2]){ m[s2]++; flag[s2]=1; } } } int cnt=0; int maxn=0; string topic; map<string ,int >::iterator it; for(it= m.begin();it!=m.end();it++){ string key=it->first; int value = it->second; // cout<<"##########value"<<value<<" key"<<key<<endl; if(value>maxn){ maxn=value; cnt=0; topic=key; } else if(value==maxn)cnt++; } cout<<topic<<endl<<maxn<<endl; if(cnt) cout << "And " << cnt << " more ..." << endl; return 0; }