05 2024 档案

摘要:点击登录按钮即跳转到新页面,而不是在当前页面加载组件 App.Vue: <script> export default { data(){ return{} } } </script> <template> // 必须加上router-view,否则会显示空白页面 <router-view></ro 阅读全文
posted @ 2024-05-28 21:05 踩坑大王 阅读(2816) 评论(0) 推荐(0) 编辑
摘要:安装Vue 安装教程: https://blog.csdn.net/weixin_49136054/article/details/129624923 创建、启动项目 创建、启动等基础操作-快速上手文档 https://cn.vuejs.org/guide/quick-start.html 创建和初 阅读全文
posted @ 2024-05-26 20:58 踩坑大王 阅读(12) 评论(0) 推荐(0) 编辑
摘要:graph LR A(软件设计)-->B(一、需求分析) A-->C(二、系统设计) B-->D(1.市场调研) B-->E(2.功能需求整合) E-->客户端功能需求 E-->管理端功能需求 C-->F(逻辑架构设计) F-->客户端 F-->业务逻辑 F-->基础服务 C-->G(技术架构设计) 阅读全文
posted @ 2024-05-26 20:44 踩坑大王 阅读(13) 评论(0) 推荐(0) 编辑
摘要:https://www.techempower.com/benchmarks/#section=data-r22&hw=ph&test=fortune&l=zijzen-7 阅读全文
posted @ 2024-05-26 18:17 踩坑大王 阅读(21) 评论(0) 推荐(0) 编辑
摘要:目录项目分析项目实现流程数据集分析一 本地数据集导入到hive二 hive查询分析三 使用sqoop将数据从hive导入mysql四 使用spark预测回头客五 使用Echarts制作可视化图表总结 项目分析 该项目设计数据预处理、存储、查询和可视化分析,涵盖Linux、MySQL,Hadoop、H 阅读全文
posted @ 2024-05-25 15:23 踩坑大王 阅读(398) 评论(0) 推荐(0) 编辑
摘要:1.部署到Linux服务器 服务器安装python 安装virtualenv 使用winscp或filezilla将程序目录上传到服务器指定目录 在服务器创建虚拟环境 激活创建的虚拟环境 安装程序目录下的requirements.txt 启动程序 unicorn main:app --host 0. 阅读全文
posted @ 2024-05-23 16:24 踩坑大王 阅读(333) 评论(0) 推荐(0) 编辑
摘要:目录问题引入特征选择信息抽取实体识别命名实体识别开放域实体识别关系抽取案例一:正则表达式抽取结构化信息二:dateuitl+正则表达式抽取日期实体三:使用pyhanlp和jieba提取命名实体 问题引入 有哪些方法能从非结构化文本中提取结构数据?或识别文本中描述的实体和关系? 特征选择 卡方统计法 阅读全文
posted @ 2024-05-23 00:13 踩坑大王 阅读(67) 评论(0) 推荐(0) 编辑
摘要:https://zhuanlan.zhihu.com/p/355997933 https://blog.csdn.net/csh1807266489/article/details/129079756 阅读全文
posted @ 2024-05-22 01:12 踩坑大王 阅读(39) 评论(0) 推荐(0) 编辑
摘要:文本表示的概念 核心:将字符串以计算机形式进行表示出来,如向量化。 分类 离散/向量表示:词袋模型(独热编码、TF-IDF、N-gram) 分布式表示:词嵌入word embedding,包括word2vec、Glove、ELMO、GPT、BERT等。 基于矩阵:基于降维表示和基于聚类表示 基于神经 阅读全文
posted @ 2024-05-20 23:14 踩坑大王 阅读(38) 评论(0) 推荐(0) 编辑
摘要:句法分析是机器翻译的核心数据结构,用于确定句子的句法结构或词汇之间的依存关系; 完全句法分析 部分句法分析 基于规则的句法分析 存在语法规则覆盖有限、系统可迁移性差等缺陷 基于统计的句法分析 主流 基于PCFG的句法分析 句法结构分析 S 表示句子(sentence),NP 表示名词短语(noun 阅读全文
posted @ 2024-05-20 17:55 踩坑大王 阅读(39) 评论(0) 推荐(0) 编辑
摘要:目录语料库中文分词基于规则的中文分词:最大匹配法正向最大匹配法逆向最大匹配法双向最大匹配法分词jiebaHMM模型 Hidden Markov Model词性标注停用词停用词种类过滤方法关键词提取TF-IDFTextRank 语料库 存放语言真实使用场景、且经过加工的例句,而非脱离具体场景的标准例句 阅读全文
posted @ 2024-05-20 03:32 踩坑大王 阅读(211) 评论(0) 推荐(0) 编辑
摘要:三个关键问题: 如何获得测试结果? → 评估方法 如何评估性能优劣? → 性能度量 如何判断实质差别? → 比较检验 目录思路总结一、性能度量1.回归任务:均方误差2.分类任务(1)错误率与精度(2)查准率P与查全率R(3)平衡点BEP:P-R曲线图/PR图(查准率-查全率曲线)(4)F1系数(4- 阅读全文
posted @ 2024-05-17 00:46 踩坑大王 阅读(177) 评论(0) 推荐(0) 编辑
摘要:https://zhuanlan.zhihu.com/p/69071435 阅读全文
posted @ 2024-05-15 15:47 踩坑大王 阅读(10) 评论(0) 推荐(0) 编辑
摘要:项目介绍 本项目旨在利用高级搜索功能,爬取微博网页版的详细数据。而大多数爬虫以单线程为主,但单线程存在资源利用率低的不足,针对这以问题,本项目主要使用如下技术: (1)多线程+协程技术+Redis实现增量式爬虫。实现过程中存在两个技术难点:一是使用redis数据传输时开销频繁,服务器容易崩溃;二是多 阅读全文
posted @ 2024-05-15 01:42 踩坑大王 阅读(58) 评论(0) 推荐(0) 编辑
摘要:待补充 阅读全文
posted @ 2024-05-13 21:08 踩坑大王 阅读(130) 评论(0) 推荐(0) 编辑
摘要:待补充 阅读全文
posted @ 2024-05-13 21:05 踩坑大王 阅读(19) 评论(0) 推荐(0) 编辑
摘要:目录安装数据库安装Redis安装PostGreSQL实现步骤微博站点分析asyncio获取cookieaiohttp+redis构造待爬取URLpyppeteer构建爬虫执行爬虫性能优化thread构建线程redis Pipline爬取异常处理总结项目总结不足 安装数据库 安装Redis 该步骤实现 阅读全文
posted @ 2024-05-12 20:35 踩坑大王 阅读(46) 评论(0) 推荐(0) 编辑
摘要:目录异步编程OpenAPI文档相关命令 异步编程 FastAPI和Sanic都是异步框架 ASGI:一种接口协议,是WSGI的扩展,为了规范支持异步的Python Web服务器、框架和应用之间的通信定制的,囊括了同步和异步的通信规范。 OpenAPI文档 http://127.0.0.1:8000/ 阅读全文
posted @ 2024-05-12 19:03 踩坑大王 阅读(68) 评论(0) 推荐(0) 编辑
摘要:目录CentOS 7.9 服务器操作查看已启动的服务AWS EC2操作 CentOS 7.9 服务器操作 查看防火墙运行状态 firewall-cmd --state 开启防火墙 sudo systemctl start firewalld 开机自启动防火墙 sudo systemctl enabl 阅读全文
posted @ 2024-05-12 15:49 踩坑大王 阅读(5) 评论(0) 推荐(0) 编辑
摘要:目录项目概述数据预处理数据爬取数据清洗构建敏感词字典树去除不相关问题和回答去除敏感词去除HTML标签去除标点符号去除emoji去除夸夸词过滤长度,转换格式 项目概述 该项目构建一个基于UniLM的生成式夸夸bot UniLM 是在微软研究院在BERT的基础上,最新产出的预训练语言模型,被称为统一预训 阅读全文
posted @ 2024-05-09 17:10 踩坑大王 阅读(54) 评论(0) 推荐(0) 编辑
摘要:__name__是python中的内置变量,表示当前模块/方法/函数的名称 当.py文件被直接运行时,if name == 'main'之下的代码块将被运行;当.py文件以模块形式被导入时,if name == 'main'之下的代码块不被运行。 如: 定义const.py PI = 3.14 de 阅读全文
posted @ 2024-05-07 17:44 踩坑大王 阅读(678) 评论(0) 推荐(0) 编辑
摘要:目录机器学习与深度学习比较神经网络简述感知机单层感知机 Perceptron多层感知机/全连接神经网络 Multilayer Perceptron/MLP卷积神经网络CNN Convolutional Nerual Nets循环神经网络RNN Recurrent Neural NetsLSTM Lo 阅读全文
posted @ 2024-05-07 14:19 踩坑大王 阅读(17) 评论(0) 推荐(0) 编辑
摘要:目录一、线性回归1.一元线性回归2.二元线性回归3.多元线性回归4.总结二、逻辑回归 一、线性回归 1.一元线性回归 f(x)=ax+b均方误差最小化(最小二乘法) 即找到一条直线,使所有样本到直线上的欧式距离之和最小 \[min\sum_{i=1}^{m}(f(x_i)-y_i)^2 = 阅读全文
posted @ 2024-05-07 14:17 踩坑大王 阅读(6) 评论(0) 推荐(0) 编辑
摘要:目录使用selenium使用requests 使用selenium from selenium.webdriver import Chrome,ChromeOptions from selenium.webdriver.support.wait import WebDriverWait from s 阅读全文
posted @ 2024-05-07 14:17 踩坑大王 阅读(66) 评论(1) 推荐(0) 编辑

more_horiz
keyboard_arrow_up light_mode palette
选择主题
点击右上角即可分享
微信分享提示