摘要: 网络爬虫 一、网络爬虫 什么是网络爬虫: 指程序在或联网上(各个网站),爬取数据(必须要在能够浏览的页面上才能爬取),然后通过清洗数据将需要的数据存入库中 爬虫的本质: 1、模拟http请求,向客户端发送请求,获取数据 2、网站内抓包 # 补充:百度其实就是一个大爬虫 -百度爬虫一刻不停的在互联网中 阅读全文
posted @ 2023-03-15 17:24 kangshong 阅读(205) 评论(0) 推荐(0) 编辑
摘要: Luffy项目 一、上线架构图 介绍: 项目通过测试后上线,将项目部署在服务器上,通常会选择部署在云服务器上 云服务器: 百度云、阿里云... 二、阿里云服务器购买 1、购买流程图 2、远程连接aliyun服务器 方式一: 直接在阿里云服务器上进行连接 1、点击控制台 2、点击实例 3、选择需要连接 阅读全文
posted @ 2023-03-15 17:20 kangshong 阅读(44) 评论(0) 推荐(0) 编辑
摘要: Luffy项目 一、文件存储 视频文件如何存储: Luffy项目会存储很多视频文件,如果把视频文件存储在media文件下,等服务器上线之后,用户既要访问接口,又要看视频,都在一个域名和端口下就会有宕机的可能,可以将视频文件单独存放在一个文件服务器上,文件服务器的带宽会比较高 什么是文件服务器: 专门 阅读全文
posted @ 2023-03-15 17:17 kangshong 阅读(36) 评论(0) 推荐(0) 编辑