天梯赛 L2-039 清点代码库 (25 分) 映射加自定义排序 c++ java 两种解法
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤10
4
)和 M(≤10
2
),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
c++:
STL很神奇吧。。能把vector作为key…
可以肯定的是需要用map,思考一下:key能否换成其他形式呢,比如字符串,也是可以的,只是写比较函数的时候需要比较复杂的处理
#include<bits/stdc++.h>
using namespace std;
string s;
int N, M;
map<vector<int>, int>m;//map可以自定义数据类型,让两个不同的数据类型对应起来
class cmp {//比较用的函数,方便使用sort排序
public:
bool operator()(const pair<vector<int>, int>& p1, const pair<vector<int>, int>& p2) {//比较的数据类型是pair类型
if (p1.second == p2.second)return p1.first < p2.first;//表示当数对的二号位置的数字相同时,比较一号位置,从小到大排序
else return p1.second > p2.second;//表示数对的二号位不同时,从大到小排序
}
};
vector<int>vv;//每次读取模块的输出,也就是一行数字
int main()
{
int a, b;
cin >> N >> M;
for (int i = 0; i < N; i++)
{
for (int j = 0; j < M; j++)
{
cin >> a;
vv.push_back(a);
}
m[vv]++;//vv对应位置的数字加一,代表该种输出的模块加一
vv.clear();//清空,方便下次循环使用
}
vector<pair<vector<int>, int> >vt(m.begin(), m.end());//创建一个vector容器,里面存放pair类型数据,数据来自map类型,一一对应
sort(vt.begin(), vt.end(), cmp());//使用sort排序,因为map没法直接使用sort,所以之前将数据存到了vector类型中
cout << vt.size() << endl;//输出有几种模块
for (vector<pair<vector<int>, int> >::iterator i = vt.begin(); i != vt.end(); i++) {
cout << i->second;//i->second对应了vt容器中的对应位置的数据也就是某位置的pair类型的数对的第二个,也就是int类型,对应着该模块的个数
for (int j = 0; j < i->first.size(); j++)//auto自动识别数据类型
{
cout << " " << i->first[j];//输出对应模块的输出
}
cout << endl;
}
return 0;
}
二刷无注释版:
#include <bits/stdc++.h>
using namespace std;
#define x first
#define y second
map<vector<int>,int> mp;
vector<pair<vector<int>,int> > ans;
bool cmp( pair<vector<int>,int> a, pair<vector<int>,int> b)
{
if(a.y!=b.y)return a.y>b.y;
return a.x<b.x;
}
int main()
{
int n,m;cin>>n>>m;
for(int i=0;i<n;++i)
{
vector<int> v;
for(int j=0;j<m;++j){
int x;cin>>x;
v.push_back(x);
}
mp[v]++;
}
ans=vector<pair<vector<int>,int> >(mp.begin(),mp.end());
sort(ans.begin(),ans.end(),cmp);
cout<<ans.size()<<endl;
for(int i=0;i<ans.size();++i){
cout<<ans[i].y;
for(int j=0;j<m;++j)cout<<" "<<ans[i].x[j];
cout<<endl;
}
return 0;
}
java 解法:java的容器使用没有c++方便:代码繁杂并且还会超内存只能得到15分,如果把vector换成int 数组应该可以通过。。
import java.util.*;
public class Main
{
static Map<Vector<Integer>,Integer> mp=new HashMap<>();
static Vector<Integer> v=new Vector<Integer>();
static class node
{
Vector<Integer> v;
int cnt;
}
static node ns[]=new node[10005];
static int cnt;
static class mcomp implements Comparator<node>
{
@Override
public int compare(node a, node b) {
if(a.cnt==b.cnt)
{
for(int i=0;i<a.v.size();++i)
{
if(a.v.get(i)!=b.v.get(i))return (int)a.v.get(i)-(int)b.v.get(i);
}
}
else return b.cnt-a.cnt;
return 0;
}
}
public static void main(String args[])
{
Scanner sc=new Scanner(System.in);
int n,m,a,b;
n=sc.nextInt();
m=sc.nextInt();
for(int i=0;i<n;++i)
{
for(int j=0;j<m;++j)
{
a=sc.nextInt();
v.addElement(a);
}
int t=1;
if(mp.containsKey(v))
{
t=mp.get(v)+1;
}
mp.put(v, t);
v=new Vector<Integer>();
}
for(Map.Entry<Vector<Integer>,Integer> entry:mp.entrySet())
{
ns[cnt]=new node();
ns[cnt].v=entry.getKey();
ns[cnt].cnt=entry.getValue();
cnt++;
}
Arrays.sort(ns,0,cnt,new mcomp());
System.out.println(cnt);
for(int i=0;i<cnt;++i)
{
System.out.print(ns[i].cnt);
for(int j=0;j<ns[i].v.size();++j)
System.out.print(" "+ns[i].v.get(j));
System.out.println();
}
}
}