03 2024 档案

摘要:高性能网站建设 曾雨坤 摘要:本文以《高性能网站建设指南》为核心理论依据,深入探讨了网站性能优化的关键策略和实法方法,简述了网站性能对用户体验及商业成功的重要性,并概述了该指南中提出的若干核心原则,如减少HTTP请求、利用CDN加速内容分发、实施缓存策略、压缩资源文件以及优化渲染流程等。在应用实践分 阅读全文
posted @ 2024-03-19 18:22 cojames 阅读(89) 评论(0) 推荐(0) 编辑
摘要:声明:本次任务简单所以没有前后端分离去做,因此不需要异步处理(cors) 根据Python将数据合并清洗,分析之后,将得到的数据存入数据库,数据库中就是各行业的类别以及数量。 前端用java的相关知识利用echarts绘制数据下钻和上卷图 前端: <!DOCTYPE html> <html> <he 阅读全文
posted @ 2024-03-19 18:21 cojames 阅读(88) 评论(0) 推荐(0) 编辑
摘要:现在的任务需求是根据关键词(以逗号分割的一列)对类别分类。 问题: 1.样本数据不够多,并且关键词来源于之前的csv文件的某一列的提取,可能本身就不太准确。 2.数据本身有空值等不合理的字段。 3.数据准备阶段需要将将中文文本转化为encoding编码 解决方案: 经过查阅资料可以选择使用朴素贝叶斯 阅读全文
posted @ 2024-03-07 18:38 cojames 阅读(54) 评论(0) 推荐(0) 编辑
摘要:分三部分:关键字提取,利用机器学习算法实现文本分类,获取行政区划编码,数据下钻后续再说 关键字提取:利用jieba分词实现读取数据库的某一列,并对该列分词。 import pymysql import pandas as pd from jieba.analyse import extract_ta 阅读全文
posted @ 2024-03-06 21:21 cojames 阅读(31) 评论(0) 推荐(0) 编辑
摘要:一、 原始数据: 二、 地域维度标准化: 地域属性在科技成果分析中作为一个重要维度,其标准取值非常必要,目前我国采用的标准行政区划代码由两部分组成,一部分为行政区划编码,六位数字组成,前两位表示省编码,中间两位代表市编码,后两位表示所属市的区或县编码。一部分为行政区划名称。两部分在数据分析中经常用到 阅读全文
posted @ 2024-03-06 21:14 cojames 阅读(62) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示