每日总结

中文新闻分词展示:

分词代码:

import jieba as fc
import pymysql
db = pymysql.connect(host="localhost", user="", passwd="", database="")
cursor = db.cursor()
sql = "select title,content from 财经";
cursor.execute(sql)
results = cursor.fetchall()
dict = {}
for one in results:
keys = fc.lcut(one[1], cut_all=False, HMM=True)
for key in keys:
if key in dict.keys():
dict[key] = dict[key] + 1
else:
dict[key] = 1
dict = sorted(dict.items(), key=lambda kv: (kv[1], kv[0]), reverse=True)
num = 0
print("开始写入数据库")
for words in dict:
if num<5000:
va = []
va.append(words[0])
va.append(words[1])
sql1 = "insert into junsiword (name,num) values(%s,%s) "
cursor.execute(sql1, va)
db.commit()
num=num+1
print("运行成功")

 

 

 

 

 

posted @   chenghaixinag  阅读(21)  评论(0编辑  收藏  举报
编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App
历史上的今天:
2020-11-26 每日总结57
点击右上角即可分享
微信分享提示