会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB

- 所有博客
- 当前博客
我的博客我的园子账号设置简洁模式 ... 退出登录

注册登录

George

博客园
首页
新随笔
联系
订阅
管理

336. 文本压缩

336. 文本压缩

中文English

给你一个只含有可见字符（ASCII 码范围

如果原文件中的字符不是英文字符，那么保留这些字符。
我们将连续的英文字符视为一个单词，单词的前后不应该还有其它的英文字符。
- 如果一个单词在它之前的文本中没有出现过，那么保留它。
- 如果一个单词在它之前出现过，将其替换成前文中它第一次出现是第几个不同单词的编号。

样例

输入：
Please, please do it--it would please Mary very,
very much.

Thanks

输出：
Please, please do it--4 would 2 Mary very,
7 much.

Thanks

说明

样例中，please 是第

注意事项

压缩中应该大小写敏感，"Abc" 和 "abc" 不是同一个单词。
文本中总的字符数为 $\le N \le 10^41≤N≤104。一个单词不会跨行显示。$

class Solution:
    """
    @param lines: the text to compress.
    @return: return the text after compression.
    """
    def textCompression(self, lines):
        # write your code here.
        if not lines: return ''

        ss = '|'.join(lines) 

        s_dict, res = {}, ''
        count, index = 0, 0
        length = len(ss)

        while index < length:
            temp_s = ''
            if ss[index].isalpha():
                right = index
                while right < length and ss[right].isalpha():
                    temp_s += ss[right] 
                    right += 1
                
                #判断是否之前已存dict
                if temp_s not in s_dict.keys():
                    count += 1
                    s_dict[temp_s] = str(count)
                else:
                    temp_s = s_dict[temp_s]
                res += temp_s   

                #更新
                index = right
            else:
                res += ss[index]
                index += 1

        #格式矫正
        results = res.split('|')
        return results

posted @ 2020-12-21 03:03 风不再来阅读(217) 评论(0) 编辑收藏举报

刷新页面返回顶部

公告

Copyright © 2024 风不再来
Powered by .NET 9.0 on Kubernetes