遇事不决,可问春风,春风不语,谨遵本心|

布都御魂

园龄:3年9个月粉丝:2关注:1

删除文章里的中文符号和空格,换成英文逗号,并获取最后两个标签

def update_biaoqian(tag_list, title):
   if tag_list==['']
print('没有标签,取标题作为标签')
        titless = re.sub('\s', ',', title)
        tag_list = title.replace('', ',').replace('', ',').replace('', ',').replace('', ',').replace(' ', ',').replace('', ',').replace('|','')
 
# 把相邻的逗号简化成一个
        tags = re.sub(r"(,)\1+", r"\1", tag_list)
        # 开头是逗号,从第二个开始取值
        if tags[0] == ',' and tags[-1] != ',':
            tags = tags[1:]
        # 结尾时句号,从倒数第二位取值
        elif tags[0] != ',' and tags[-1] == ',':
            tags = tags[:-1]

        elif tags[0] == ',' and tags[-1] == ',':
            tags = tags[1:-1]
        elif tags[0] != ',' and tags[-1] != ',':
            tags = tags
        # 以逗号作为分隔符,取二个
        tags_list = tags.split(',')[-2:]
        tag = ''
        for tags in tags_list:
            tag += tags + ','
        tag = tag[:-1]
    else:
        tag_list = ''.join(tag_list)
        # 把空格,顿号,逗号,句号,问号,分好转换成英文逗号
        tag_list = tag_list.replace('', ',').replace('', ',').replace('', ',').replace('', ',').replace(' ', ',').replace('', ',').replace('|','')
        # 把相邻的逗号简化成一个
        tags = re.sub(r"(,)\1+", r"\1", tag_list)
        # 开头是逗号,从第二个开始取值
        if tags[0] == ',' and tags[-1] != ',':
            tags = tags[1:]
        # 结尾时句号,从倒数第二位取值
        elif tags[0] != ',' and tags[-1] == ',':
            tags = tags[:-1]

        elif tags[0] == ',' and tags[-1] == ',':
            tags = tags[1:-1]
        elif tags[0] != ',' and tags[-1] != ',':
            tags = tags
        # 以逗号作为分隔符,取二个
        tags_list = tags.split(',')[-2:]
        tag = ''
        for tags in tags_list:
            tag += tags + ','
        tag = tag[:-1]
    return tag

 

本文作者:布都御魂

本文链接:https://www.cnblogs.com/wolvies/p/17654029.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   布都御魂  阅读(14)  评论(0编辑  收藏  举报
历史上的今天:
2021-08-24 把xlsx文件导入到mysql数据库
2021-08-24 pandas库中dataframe数据类型常用函数集合
2021-08-24 ValueError: invalid literal for int() with base 10
2021-08-24 openpyxl报错:OSError: File contains no valid workbook part
   
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起