04 2022 档案

摘要:Switch(config)#no enable secret no 命令通常用来否定某一命令或将其设置为默认值。 阅读全文
posted @ 2022-04-22 14:39 王舰 阅读(277) 评论(0) 推荐(0)
摘要:退出XAMPP控制面板后报错:exception eaccessviolation in module xampp-control.exe at 0025b292 找到 xampp-control.exe 所在位置 选择以管理员运行此程序 点击更改所有用户设置 选择以管理员运行此程序 确定。 阅读全文
posted @ 2022-04-22 09:13 王舰 阅读(738) 评论(0) 推荐(0)
摘要:先查看待修改网卡的MAC地址 ```bash cat /sys/class/net/网卡名/address ``` 得到的是一串十六进制值 ![image-20220311184629051](https://img2023.cnblogs.com/blog/2119256/202308/21192 阅读全文
posted @ 2022-04-07 11:39 王舰 阅读(1567) 评论(0) 推荐(2)
摘要:一、概述 以下文字摘自《数据结构与算法分析 C语言描述》 ​ 编译器检查程序的语法错误,但是常常由于缺少一个符号(如遗漏一个花括号或注释起始符)引起编译器列出上百行的诊断,而真正的错误并没有找出。 ​ 在这种情况下,可以使用一个程序来检验是否每个符号都成对出现。于是,每一个右花括号、右方括号及右圆括 阅读全文
posted @ 2022-04-07 11:39 王舰 阅读(256) 评论(0) 推荐(1)
摘要:如果是虚拟机,先关闭 DHCP 服务 ![image-20220311181116082](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811090418545-982890443.png) 编辑 /etc/systemd 阅读全文
posted @ 2022-04-07 11:38 王舰 阅读(3613) 评论(0) 推荐(1)
摘要:CMake 并不会自动链接 math 库,也需要手动链接,加上一句 target_link_libraries 即可 add_executable(radix_sort sorting/radix_sort.c) target_link_libraries(radix_sort m) 阅读全文
posted @ 2022-04-07 11:38 王舰 阅读(453) 评论(0) 推荐(1)
摘要:## 一、算法描述 选择排序是从待排序数组中通过比较选择最小(最大)的元素,将其放在数组的前面(后面)。重复遍历选择多次直到数组有序。遍历一次即找到当前未排序数组的最小(最大)值,那么剩下最后一个元素一定是最大(最小)的,最后一次遍历就不需要了,假设数组大小未n,就要遍历 n - 1次,也即是外层循 阅读全文
posted @ 2022-04-07 11:37 王舰 阅读(436) 评论(0) 推荐(1)
摘要:## 一、算法描述 假设待排序数组有 N 个整数,且范围是 1 到 M(或 0 到 M - 1)。留置一个数组称为 buckets,大小为 M,并初始化为 0。所以数组 buckets 有 M 个单元(或 “桶” ),开始的时候它们都是空的。遍历待排序数组,当 a~i~ 读入时 buckets[a~ 阅读全文
posted @ 2022-04-07 11:37 王舰 阅读(217) 评论(0) 推荐(1)
摘要:## 一、问题描述 大早上的,第一个命令就报错了,服了。用 pacman 更新,其它源都没有问题,唯独到了 archlinuxcn 报错 SSL 证书有问题。 ```bash sudo pacman -Syu ``` ![image-20220117091355360](https://img202 阅读全文
posted @ 2022-04-07 11:36 王舰 阅读(1360) 评论(0) 推荐(1)
摘要:一、相关问题 正常的 C 程序,像是使用了 stdio 或是 stdlib 等库的程序在编译时都是直接编译的,不需要指定任何链接选项。 例如: gcc test.c -o test 但是如果程序中使用了 math 库,直接编译会报如下错误: /usr/bin/ld: /tmp/cc1aTRz1.o: 阅读全文
posted @ 2022-04-07 11:36 王舰 阅读(965) 评论(0) 推荐(3)
摘要:## 一、算法描述 比较相邻两个元素,如果第一个比第二个大则交换两个值。遍历所有的元素,每一次都会将未排序序列中最大的元素放在后面。假设数组有 n 个元素,那么需要遍历 n - 1 次,因为剩下的一个元素一定是最小的,无需再遍历一次。因此需要两层循环,第一层是遍历次数,第二层是遍历未排序数组。 动图 阅读全文
posted @ 2022-04-07 11:35 王舰 阅读(330) 评论(0) 推荐(1)
摘要:[TOC](本文目录) ## 预备知识 **集成电路封装**(英语:**integrated circuit packaging**),简称**封装**,是[半导体器件制造](https://zh.wikipedia.org/wiki/半导体器件制造)的最后阶段,之后将进行集成电路性能测试。器件的核 阅读全文
posted @ 2022-04-07 11:34 王舰 阅读(2605) 评论(0) 推荐(1)
摘要:[TOC](本文目录) # Linux 在虚拟机上安装 Arch Linux ## 安装前 ### 硬件配置 4G 内存,2 * 2 CPU,119G 外存(预先分配) ![image-20211115090305879](https://img2023.cnblogs.com/blog/21192 阅读全文
posted @ 2022-04-07 11:33 王舰 阅读(168) 评论(0) 推荐(1)
摘要:Arch Linux 移除不使用的包 参考 https://wiki.archlinux.org/title/Pacman/Tips_and_tricks#Removing_unused_packages_(orphans) 递归地删除包和它的配置文件 # pacman -Qtdq | pacman 阅读全文
posted @ 2022-04-07 11:33 王舰 阅读(7350) 评论(0) 推荐(2)
摘要:> 源码地址:[https://github.com/pineapple-cpp/bing-image-spider](https://github.com/pineapple-cpp/bing-image-spider) 保存壁纸信息到数据库 + 保存高清壁纸(约3.5G)只需70s ![imag 阅读全文
posted @ 2022-04-07 11:32 王舰 阅读(508) 评论(0) 推荐(0)
摘要:[TOC](避坑目录) ## 安装报错 默认的msi安装程序会将 MongoDB 设置为系统服务,导致开启服务的适合没有权限,大概是这样的错误:`Service 'MongoDB Server'(MongoDB) failed to start.Verify that you have suffic 阅读全文
posted @ 2022-04-07 11:31 王舰 阅读(117) 评论(0) 推荐(0)
摘要:## 问题描述 aiohttp 的 getting started 入门案例是这样写的 ```python import aiohttp import asyncio async def main(): async with aiohttp.ClientSession() as session: a 阅读全文
posted @ 2022-04-07 11:30 王舰 阅读(3068) 评论(0) 推荐(4)
摘要:[TOC](文章目录) # 一、前言 一开始在 Windows 上编译运行 C 用的是 MinGW,一堆毛病,比如输出中文乱码,在 Clion下输入后会自动输出,gcc 版本比较老等。换了用Cygwin后才发现这家伙真好,不仅没有上面的问题,还有一个包管理器能够选择很多不同版本的包。 # 二、安装 阅读全文
posted @ 2022-04-07 11:27 王舰 阅读(2113) 评论(2) 推荐(0)
摘要:项目场景: 测试爬虫时需要挂代理,在Charles上测试一下。 问题描述: 这是requests挂代理的代码: proxies = { 'http': 'http://127.0.0.1:8888', 'https': 'https://127.0.0.1:8888' } response = re 阅读全文
posted @ 2022-04-07 11:26 王舰 阅读(1977) 评论(0) 推荐(0)
摘要:前言 ​ 最近在读《微积分的力量》,书中讲到了阿基米德(Archimedes)的《抛物线求积法》("Quadrature of the Parabola")描述了阿基米德如何求解抛物线与直线围成的抛物线弓形的面积。解决这一问题的关键点是证明每个新构建三角形的面积都是上一层级三角形面积的1/8,可是作 阅读全文
posted @ 2022-04-07 11:25 王舰 阅读(5587) 评论(6) 推荐(1)
摘要:总结自Stackoverflow:How to upgrade all Python packages with pip @(文章目录) 方法一:pip命令 温馨提示:此命令仅适于Linux用户 pip list --outdated --format=freeze | grep -v '^\-e' 阅读全文
posted @ 2022-04-07 11:24 王舰 阅读(11543) 评论(0) 推荐(3)
摘要:# Flask + Echarts + sklearn 做个简单的线性回归 @[TOC] Echarts官网的线性回归示例是用了echarts-stat.js这个插件https://github.com/ecomfe/echarts-stat,在前端完成训练模型和预测的操作 正好最近解除了pytho 阅读全文
posted @ 2022-04-07 11:22 王舰 阅读(587) 评论(0) 推荐(0)
摘要:# Python pandas concat 连接时指定索引顺序 一些旧的教材上,在使用concat连接时,使用join_axes参数指定顺序,但这已经过时了,因为报错。 ```python >>> import pandas as pd >>> >>> one = pd.DataFrame([[0 阅读全文
posted @ 2022-04-07 11:22 王舰 阅读(719) 评论(0) 推荐(1)
摘要:Python 进阶 线程池 1. 概述 线程池的基类是 concurrent.futures 模块中的 Executor,Executor 提供了两个子类,即 ThreadPoolExecutor 和 ProcessPoolExecutor,其中 ThreadPoolExecutor 用于创建线程池 阅读全文
posted @ 2022-04-07 11:21 王舰 阅读(208) 评论(0) 推荐(0)
摘要:# Linux 为Typora搭建一个图床 @[Toc] ## 1. 安装软件 安装nodejs、npm、`picgo` ```bash $ sudo apt-get install nodejs npm $ sudo npm install picgo -g ``` ## 2. 选择图床 ### 阅读全文
posted @ 2022-04-07 11:20 王舰 阅读(287) 评论(0) 推荐(0)
摘要:总结自:MySQL Crash Course(MySQL必知必会)https://e.jd.com/30154378.html?ebook=1 MySQL-用户管理 mysql> use mysql; mysql> select user from user; mysql> select user 阅读全文
posted @ 2022-04-07 11:19 王舰 阅读(157) 评论(0) 推荐(0)
摘要:@[TOC] ## jinja2原理 Flask 的render_template默认使用了jinja2的模板引擎渲染页面 demo.py ```python from flask import Flask, render_template app = Flask(__name__) @app.ro 阅读全文
posted @ 2022-04-07 11:18 王舰 阅读(907) 评论(0) 推荐(0)
摘要:## 拦截器 对接口请求进行预先处理,然后再交由控制器。(中间关卡) ![在这里插入图片描述](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811091336621-1027406367.png) 比如用户如果没有登录,则 阅读全文
posted @ 2022-04-07 11:17 王舰 阅读(5509) 评论(0) 推荐(1)
摘要:时间戳转为日期 time模块,使用localtime转换,再使用strftime格式化 import time timestamp = 1609834156 date = time.localtime(timestamp) format_date = time.strftime('%Y-%m-%d 阅读全文
posted @ 2022-04-07 11:16 王舰 阅读(2491) 评论(0) 推荐(0)
摘要:复习总结一下redis, 为之后的大规模分布式爬虫做准备 @ 前戏 进入命令行模式 redis-cli 查询所有key 127.0.0.1:6379> KEYS * 1) "proxies:universal" 查询key 存储在 redis服务器中的类型,确认是有序集合ZSET类型 127.0.0 阅读全文
posted @ 2022-04-07 11:16 王舰 阅读(275) 评论(0) 推荐(0)
摘要:字典很重要 字典dict 是Python中很重要的一个数据类型, 通过键值映射, 能够很好的定位查找. Django, Flask这些Web框架在做前后端分离时, 就是用字典传数据的, 因为它和列表list 配合起来, 能够很好的与json格式的数据相互转化. 用Flask + Echarts做数据 阅读全文
posted @ 2022-04-07 11:14 王舰 阅读(74) 评论(0) 推荐(0)
摘要:Python Flask 框架 .............. 数据库链接池 pip3 install pymysql dbutils 简单实现 ''' @Date : 2020-11-12 20:02:49 @LastEditors : Pineapple @LastEditTime : 2020- 阅读全文
posted @ 2022-04-06 15:08 王舰 阅读(1264) 评论(0) 推荐(0)
摘要:随便写一个装饰器: def pine(func): def inner(*args, **kwargs): """This is inner""" return func(*args, **kwargs) return inner @pine def apple(): """This is appl 阅读全文
posted @ 2022-04-06 15:07 王舰 阅读(210) 评论(0) 推荐(0)
摘要:Numpy中,给定范围内取随机数: numpy.random.randint(low, high=None, size=None, dtype=int) 从低(包含)到高(不含)返回随机整数。 如果只传参数low, 那么得到的随机数将小于low(不包括low), 随机值的区间为[0, low) >> 阅读全文
posted @ 2022-04-06 15:07 王舰 阅读(195) 评论(0) 推荐(0)
摘要:## 一、问题描述 代码 ```python ''' @Date : 2020-10-20 14:17:15 @LastEditors : Pineapple @LastEditTime : 2020-10-30 17:42:21 @FilePath : /Bus_station/#test.py 阅读全文
posted @ 2022-04-06 15:06 王舰 阅读(314) 评论(0) 推荐(0)
摘要:## 一、前言 今天是1024程序员节,大家节日快乐。听说今天发博客会得一枚1024勋章,一年一次呢,真是稀有。写篇博客顺便把这几天学习的相关知识总结一下。 ## 二、为什么要学习反爬虫 从暑假算起到现在,我也接触了4个月的爬虫,期间做过不少测试和实战,越往后学,越是难学。倒不是难在设计爬虫,编写P 阅读全文
posted @ 2022-04-06 15:05 王舰 阅读(2358) 评论(0) 推荐(0)
摘要:random.getrandbits(k) 返回带有 k 位随机的Python整数。 此方法随 MersenneTwister 生成器一起提供,其他一些生成器也可以将其作为API的可选部分提供。 如果可用,getrandbits() 启用 randrange() 来处理任意大范围。 在 3.9 版更 阅读全文
posted @ 2022-04-06 15:05 王舰 阅读(587) 评论(0) 推荐(0)
摘要:## 一、前言 最近一直在折腾双系统的事情,我看了一下,大约有10天没写博客哈哈,也没咋学习。以后打算把deepin作为开发工具,折腾了几天系统,基本的环境jdk,python,vmware啥的都搭建好了,接下来终于可以回归爬虫的学习,不过在这前的头等大事还是抓包工具配置Charles。 ## 二、 阅读全文
posted @ 2022-04-06 15:04 王舰 阅读(1200) 评论(0) 推荐(0)
摘要:## 一、任务目标 针对一个文本的内容,提取其中的所有单词并去重 文本去重前 ![文本](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811091738709-204887536.png) 去重后 ![去重后](https 阅读全文
posted @ 2022-04-06 15:03 王舰 阅读(590) 评论(0) 推荐(0)
摘要:## 一、问题描述 ![在这里插入图片描述](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811093115707-2147056981.png) ## 二、问题分析 之前都是写完程序后直接打包到集群上运行的,这样确实有点 阅读全文
posted @ 2022-04-06 15:02 王舰 阅读(719) 评论(0) 推荐(0)
摘要:## 一、问题描述 本地运行MapReduce程序并不能像在集群上那样输出日志信息,而且还回报log4j的警告 ![在这里插入图片描述](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811093205485-1756444 阅读全文
posted @ 2022-04-06 15:02 王舰 阅读(220) 评论(0) 推荐(0)
摘要:## 一、MapReduce介绍 MapReduce是一个`分布式计算框架`,可以部署在Hadoop、Spark等大数据平台上,实现海量数据的并行计算。它采用“`分而治之`”的思想,将一个计算任务交给集群中的多台机器共同完成,之后再汇总成最终结果。 一般来说读取一个TB,PB级的文件,普通计算机的速 阅读全文
posted @ 2022-04-06 15:00 王舰 阅读(2029) 评论(0) 推荐(0)
摘要:## 一、集群描述 主机:CentOS7.8 jdk1.8 hadoop、hive、hbase、zookeeper:CDH5.14.2 ||namenode|datanode1|datanode2| |--|--|-|-| |NameNode|✔(主)|✔(备)|✘| |DataNode|✔|✔|✔ 阅读全文
posted @ 2022-04-06 14:59 王舰 阅读(9201) 评论(1) 推荐(1)
摘要:## Github项目链接: [https://github.com/Pineapple666/TaobaoSpider](https://github.com/Pineapple666/TaobaoSpider) ## 一、问题描述 我一开始写爬虫的时候,数据用的是Linux虚拟机的`mysql5 阅读全文
posted @ 2022-04-06 14:58 王舰 阅读(595) 评论(0) 推荐(0)
摘要:今天在DEBUG的时候又出现了一个问题,用Scrapy下载图片,需要重写ImagesPipeline类的item_completed方法。 书上代码如下: ```python def item_completed(self, results, item, info): image_paths = [ 阅读全文
posted @ 2022-04-06 14:50 王舰 阅读(564) 评论(0) 推荐(0)
摘要:## 一、前言 大概是一个月前就开始做淘宝的爬虫了,从最开始的用selenium用户配置到selenium模拟登录,再到这次的post请求模拟登录。一共是三篇博客,记录了我爬取淘宝网的经历。期间也有朋友向我提出了不少问题,比如滑块失败,微博登录失败等,可以说用selenium模拟登录这方面,坑特别多 阅读全文
posted @ 2022-04-06 14:49 王舰 阅读(2693) 评论(5) 推荐(0)
摘要:## 一、前言 Github源码链接:[https://github.com/Python3WebSpider/GithubLogin](https://github.com/Python3WebSpider/GithubLogin) 崔庆才:[https://cuiqingcai.com/8229 阅读全文
posted @ 2022-04-06 14:48 王舰 阅读(461) 评论(0) 推荐(0)
摘要:![在这里插入图片描述](https://img2023.cnblogs.com/blog/2119256/202308/2119256-20230811093402601-1082738617.png) [承接上一篇博客,直接上代码,解析请看上篇。](https://blog.csdn.net/p 阅读全文
posted @ 2022-04-06 14:46 王舰 阅读(123) 评论(0) 推荐(0)
摘要:迭代器是生成器的一种,使用迭代器生成可迭代对象,可以避免创建巨大的列表或元组。 昨天DEBUG的时候,出现了一个BUG:TypeError: 'async_generator' object is not iterable,async_generator对象不可迭代 以下,是我的解决过程。 问题 ) 阅读全文
posted @ 2022-04-06 14:44 王舰 阅读(7006) 评论(0) 推荐(0)
摘要:**`博客跟新说明`**:[爬取时间已缩短至29.4s](https://blog.csdn.net/pineapple_C/article/details/108054727) <<<<==传送门== ## 一、前言 英雄联盟是一款很火的游戏,像我这种没玩过的都知道`疾风剑豪-亚索`,我便以此展示 阅读全文
posted @ 2022-04-06 14:43 王舰 阅读(675) 评论(0) 推荐(0)
摘要:## 一、前言 最近一直在搞滑块验证码,发现它比之前的极验验证码又提升了一个档次。验证码只提供两张拼图,不提供原图。所以通过对比两张图片来寻找缺口的方法已经不适用了!所以要用一些图像处理和计算机视觉相关的方法,比如openCV。但是这个东西太深奥了,又和python的另一个第三方库:numpy紧密结 阅读全文
posted @ 2022-04-06 14:42 王舰 阅读(5461) 评论(1) 推荐(1)
摘要:## 一、前言 `重大跟新`:[https://blog.csdn.net/pineapple_C/article/details/108181761](https://blog.csdn.net/pineapple_C/article/details/108181761)`post请求模拟登录淘宝 阅读全文
posted @ 2022-04-06 14:41 王舰 阅读(2064) 评论(0) 推荐(0)
摘要:玩王者荣耀有4年了,一直很喜欢这个游戏。记不得是哪天了,当时刚刚接触python,看见网上有人用python爬取王者荣耀全皮肤图片,虽然看不懂,但满是羡慕,也想着有一天能够自己写一个程序爬我喜欢的东西。 看了大神的文章后开始自学爬虫,期间也进行过一些尝试,但结果总是不尽人意。于是利用暑假的时间,买了 阅读全文
posted @ 2022-04-06 14:40 王舰 阅读(511) 评论(1) 推荐(0)
摘要:`重大跟新`:[https://blog.csdn.net/pineapple_C/article/details/108181761](https://blog.csdn.net/pineapple_C/article/details/108181761)`post模拟登录淘宝并爬取商品列表` 像 阅读全文
posted @ 2022-04-06 14:39 王舰 阅读(1293) 评论(0) 推荐(0)
摘要:复制以下的代码,选择运行的函数,验证有关矩阵、多项式的操作。 相关参考:[Python语言程序设计(上海交通大学出版社 赵璐主编)](https://item.jd.com/69301324844.html) print(f(1)) # 当x=1时,输出多项式的值 0 print(f(2)) # 5 阅读全文
posted @ 2022-04-06 14:36 王舰 阅读(617) 评论(0) 推荐(0)
摘要:复制以下的代码,选择运行的函数,验证有关数组的操作。 相关参考:Python语言程序设计(上海交通大学出版社 赵璐主编)<< 传送门 原谅我没有找到电子版,不然一定爬下来 解释和输出都在注释中 # -*- coding: utf-8 -*- import numpy as np # 创建数组的相关操 阅读全文
posted @ 2022-04-06 14:35 王舰 阅读(212) 评论(0) 推荐(0)
摘要:本文参考:[数据酷客](http://cookdata.cn/course/course_introduction/17/) 上个月写了一篇[Hive数据仓库基本操作](https://blog.csdn.net/pineapple_C/article/details/104985154)过了这么长 阅读全文
posted @ 2022-04-06 14:34 王舰 阅读(681) 评论(0) 推荐(1)
摘要:质数就是大于等于2且只能被它本身及1整除的数,百度上关于质数的性质和相关的公式还有很多,不过有点高深难懂,尤其是对我这个数学不好的人来说。 网上python判断质数的方法大多是下面这种: from math import sqrt def is_prime(n): if n == 1: print( 阅读全文
posted @ 2022-04-06 14:33 王舰 阅读(471) 评论(0) 推荐(0)
摘要:为了加深一下Hive操作的印象,也为了方便以后的学习,罗列一下Hive的基本操作。 一、Hive基本操作 1.在Linux本地新建/data/hive目录: mkdir -p /data/hive 2.切换到/data/hive目录下,使用ftp工具将作业附件中的stu_group.txt文件上传到 阅读全文
posted @ 2022-04-06 14:31 王舰 阅读(699) 评论(0) 推荐(0)