PAT 乙级 1078.字符串压缩与解压 C++/Java
题目来源
文本压缩有很多种方法,这里我们只考虑最简单的一种:把由相同字符组成的一个连续的片段用这个字符和片段中含有这个字符的个数来表示。例如 ccccc
就用 5c
来表示。如果字符没有重复,就原样输出。例如 aba
压缩后仍然是 aba
。
解压方法就是反过来,把形如 5c
这样的表示恢复为 ccccc
。
本题需要你根据压缩或解压的要求,对给定字符串进行处理。这里我们简单地假设原始字符串是完全由英文字母和空格组成的非空字符串。
输入格式:
输入第一行给出一个字符,如果是 C
就表示下面的字符串需要被压缩;如果是 D
就表示下面的字符串需要被解压。第二行给出需要被压缩或解压的不超过 1000 个字符的字符串,以回车结尾。题目保证字符重复个数在整型范围内,且输出文件不超过 1MB。
输出格式:
根据要求压缩或解压字符串,并在一行中输出结果。
输入样例 1:
C
TTTTThhiiiis isssss a tesssst CAaaa as
输出样例 1:
5T2h4is i5s a3 te4st CA3a as
输入样例 2:
D
5T2h4is i5s a3 te4st CA3a as10Z
输出样例 2:
TTTTThhiiiis isssss a tesssst CAaaa asZZZZZZZZZZ
分析:
压缩
遍历字符串,cnt记录字符出现的次数
遇到相同的字符,cnt++
遇到不同的字符,输出cnt, 同时输出上一个字符
注意:
- 输出完一个字符,cnt置1
- 如果cnt为1,就不输出cnt
解压
遍历字符串
5T2h4is i5s a3 te4st CA3a as10Z
像这样的字符串,先判断字符是不是数字
如果是:用cnt记录数字
如果不是:
cnt == 1
:只输出字符cnt >= 1
:输出cnt个字符
注意:
- 有可能出现两位数字,如
as 10Z
- 应该用
string
类型记录数字,然后将它转为int
类型
- 应该用
C++实现:
#include <iostream>
#include <vector>
#include <string>
using namespace std;
bool isNum(char c) {
return '0' <= c && c <= '9';
}
// 压缩
void compress(string str) {
int cnt = 1;
for (int i = 1; i < str.size(); ++i) {
if (str[i] == str[i - 1]) {
cnt++;
}
else {
for (int j = 0; j < cnt; ++j) {
if (cnt != 1) {
cout << cnt;
}
cout << str[i - 1];
cnt = 1;
}
}
}
if (cnt != 1) {
cout << cnt;
}
cout << str[str.size() - 1];
}
// 解压
void decompress(string str) {
int cnt = 1;
// 保存数字,也许有两位数
string numStr = "";
for (int i = 0; i < str.size(); ++i) {
if (isNum(str[i])) {
numStr += str[i];
}
else {
if (numStr == "") {
cnt = 1;
}
else {
cnt = stoi(numStr);
}
for (int j = 0; j < cnt; ++j) {
cout << str[i];
}
cnt = 1;
// 输出完记得清空
numStr.clear();
}
}
}
int main() {
char c;
string str;
cin >> c;
cin.get();
getline(cin, str);
if (c == 'C') {
compress(str);
}
else {
decompress(str);
}
return 0;
}
Java实现:
// TODO