3数据分析每日进度报告02
今天主要完成了关键词的提取,不过根据结果看来,提取的不是很理想,关键词提取不是很准确,用的不是pyltp,而是jieba,所以关键词会有很多问题整个过程中,遇到了很多的问题,如下:
1.pyltp安装失败(未解决)
我的python环境是3.7,从网上找了很多的解决办法,仍然解决不了,于是我就换了个方法,最后用了jieba
遇到类似问题时参考,希望能帮助大家:哈工大自然语言处理工具pyltp的本地安装方法
2.jieba关键词提取:参考:如何用Python提取中文关键词?
3.python pymysql向数据库中更新数据,涉及到数据含单、双引号
解决办法为将字符串进行转义:
def transferContent(content): if content is None: return None else: string = "" for c in content: if c == '"': string += '\\\"' elif c == "'": string += "\\\'" elif c == "\\": string += "\\\\" else: string += c return string
在使用update函数之后,需要添加一条语句,否则数据不会在数据库进行更新:
db.commit() # 执行update操作时需要写这个,否则就会更新不成功
1 # 使用execute方法执行SQL语句 2 sql = "update base_beijing set 关键词 = '{}' WHERE 成果名称 = '{}' ".format(key,name1) 3 print(sql) 4 cursor.execute(sql) 5 db.commit() # 执行update操作时需要写这个,否则就会更新不成功
参考: