python中字符串的拼接+和join()谁的效率更高

一、 字符串拼接的两种方法
程序当中经常出现需要不断接收新字符串并将这些字符串组成新字符串输出的情况。
该方法一般有两种解决方案,

创建一个空字符串(test_str),将每次新传入的 new_str 使用 ‘test_str += new_str’ 的方式添加到原有字符串中,返回test_str
创建一个空列表(test_list),将每次新传入的 new_str 使用 append(new_str) 的方式添加到列表当中,返回=="".join(test_list)==
二、 效率之间的比较

import time

# 装饰器,计算程序运行时间
def start_time(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        res = func(*args, **kwargs)
        print(func.__name__, time.time() - start)
        return res

    return wrapper


# 使用 append 和 join 实现连续字符串拼接
@start_time
def test_1(frequency, string):
    s = []
    for i in range(frequency):
        s.append(string)
    return ''.join(s)


# 使用 += 实现连续字符串拼接
@start_time
def test_2(frequency, string):
    s = ''
    for i in range(frequency):
        s += string
    return s


name = 'P'
for i in range(25):
    print('\n数据量为2的{}次方'.format(i))
    f = 2 ** i
    test_1(f, name)
    test_2(f, name)

 

 

三、 结论

注:具体测试结果会因硬件性能差别而有较大差异,趋势不会变。

字符串长度在百万以下:两种方式区别不大,join() 方法会快 25% 左右
字符串长度在百万以上:+=的方法所消耗的时间会指数级的增加,(百万以下也指数级增加,只是不明显),join() 方法会有明显优势。
当代码当中的 name 长度越长,+= 方法的弊端就越明显。


四、 分析
Python中字符串是不可变对象,修改字符串就得将原字符串中的值复制,开辟一块新的内存,加上修改的内容后写入到新内存中,以达到“修改”字符串的效果。在使用“+”拼接字符串时,正是使用了重复性的复制、申请新内存、写入值到新内存的工作一遍遍的将字符串的值修改。
而使用join()方法拼接字符串时,会先计算总共需要申请多少内存,然后一次性申请所需内存并将字符串复制过去。这样便省去了重复性的内存申请和写入,节省了时间消耗。


原文链接:https://blog.csdn.net/weixin_46491071/article/details/109786998

posted @ 2021-09-07 00:06  GalaxyStar  阅读(792)  评论(0编辑  收藏  举报