7-3 清点代码库 (20 分) 上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位有

2022/2/25 17:26:11

本文主要是介绍7-3 清点代码库 (20 分) 上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位有,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

文章目录

  • 题目描述
  • 输入格式
  • 输出格式
  • 输入样例
  • 输出样例
  • 代码
  • 思路

7-3 清点代码库 (20 分)

题目描述

在这里插入图片描述
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位有啥想法,我当时就懵了,然后就挂了。。。”

这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式

输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。

随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。

输出格式

首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。

注:所谓数列 { A1,…, AM} 比 { B1,…, BM} 大,是指存在 1≤i<M,使得 A1=B1,…,Ai=Bi成立,且 Ai+1>Bi+1

输入样例

7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例

4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35

代码

#include <iostream>
#include<string>
#include<cmath>
#include<vector>
#include <queue>
#include <iomanip>
#include<algorithm>
#include<set>
#include<map>
using namespace std;
string s;
int N, M;
map<vector<int>, int>m;//map可以自定义数据类型,让两个不同的数据类型对应起来
struct cmp {//比较用的函数,方便使用sort排序
	bool operator()(const pair<vector<int>, int>& p1, const pair<vector<int>, int>& p2) {//比较的数据类型是pair类型
		if (p1.second == p2.second)return p1.first < p2.first;//表示当数对的二号位置的数字相同时,比较一号位置,从小到大排序
		else return p1.second > p2.second;//表示数对的二号位不同时,从大到小排序
	}
};
vector<int>vv;//每次读取模块的输出,也就是一行数字
int main()
{
	int a, b;
	cin >> N >> M;
	for (int i = 0; i < N; i++)
	{
		bool bo = true;
		for (int j = 0; j < M; j++)
		{
			cin >> a;
			vv.push_back(a);
		}
		m[vv]++;//vv对应位置的数字加一,代表该种输出的模块加一
		vv.clear();//清空,方便下次循环使用
	}
	vector<pair<vector<int>, int>>vt(m.begin(), m.end());//创建一个vector容器,里面存放pair类型数据,数据来自map类型,一一对应
	sort(vt.begin(), vt.end(), cmp());//使用sort排序,因为map没法直接使用sort,所以之前将数据存到了vector类型中
	cout << vt.size() << endl;//输出有几种模块
	for (auto i = vt.begin(); i != vt.end(); i++) {
		cout << i->second;//i->second对应了vt容器中的对应位置的数据也就是某位置的pair类型的数对的第二个,也就是int类型,对应着该模块的个数
		for (auto j = 0; j < i->first.size(); j++)//auto自动识别数据类型
		{
			cout << " " << i->first[j];//输出对应模块的输出
		}
		cout << endl;
	}
	return 0;
}

思路

采用map数据类型让vector类型与int类型一一对应,表示同一种模块的个数。使用pair存map中的数据,再使用sort进行排序,写出对应的sort排序规则即可完成输出数据的排序,最后再循环输出即可。关键在于map和pair数据类型的使用,大大简化了问题的复杂性。



这篇关于7-3 清点代码库 (20 分) 上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位有的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程