douzujun - 博客园

2020年5月4日

摘要：计算机网络常见面试题总结 https://github.com/huihut/interview#computer-network https://blog.csdn.net/qzcsu/article/details/72861891 1. OSI，TCP/IP，五层协议的体系结构 OSI分层（7 阅读全文

posted @ 2020-05-04 18:08 douzujun 阅读(3539) 评论(0) 推荐(1) 编辑

2020年4月25日

复试：python的random

摘要：阅读全文

posted @ 2020-04-25 21:14 douzujun 阅读(235) 评论(0) 推荐(1) 编辑

2020年4月14日

B站账号：皮一下很开心的豆子 https://space.bilibili.com/152063970

摘要： B站账号：皮一下很开心的豆子 https://space.bilibili.com/152063970 阅读全文

posted @ 2020-04-14 19:42 douzujun 阅读(584) 评论(0) 推荐(0) 编辑

2020年3月26日

python进行日期计算

摘要： from dateutil import rrule from datetime import datetime import time #计算日期差 untilYear = 2018 untilMonth = 5 untilDay = 1 # 2018年第一天 firstDay = datetim 阅读全文

posted @ 2020-03-26 19:55 douzujun 阅读(576) 评论(0) 推荐(0) 编辑

2020年3月20日

【复试 python程序设计第2版董付国】python特殊方法与运算符重载

摘要： 1. 实例方法 1.1 __add__(self, n) # -*- coding: utf-8 -*- # 数组类，支持数组与数字之间的四则运算 # 数组之间的加法运算，内积运算和大小比较 # 数组元素访问和修改 # 成员测试 class MyArray: __value = [] __size 阅读全文

posted @ 2020-03-20 23:48 douzujun 阅读(271) 评论(0) 推荐(0) 编辑

2020年3月17日

python输出连续的字母【正则表达式】

摘要：那个 \1 是引用第一个分组，这个例子里面就是输出连续的字母第一个括号：匹配除换行符以外的任意字符。后面的括号：匹配相同的字符，所以输出的元组有两个元素。阅读全文

posted @ 2020-03-17 20:40 douzujun 阅读(1652) 评论(0) 推荐(1) 编辑

2020年3月10日

【复试 python程序设计第2版董付国】print函数

摘要：阅读全文

posted @ 2020-03-10 21:05 douzujun 阅读(301) 评论(0) 推荐(0) 编辑

2020年3月9日

【复试 python程序设计第2版董付国】python内置函数和常用函数

摘要： 1. 内置函数 1.1 dir 1.2 help 2. math 阅读全文

posted @ 2020-03-09 23:44 douzujun 阅读(258) 评论(0) 推荐(0) 编辑

【复试 python程序设计第2版董付国】python统计c++源程序文件中不重复代码行数

摘要： # -*- coding: utf-8 -*- from os.path import isdir, join from os import listdir AllLines = [] # 保存所有代码行 NotRepeatedLines = [] # 保存非重复的代码行 file_num = 0 阅读全文

posted @ 2020-03-09 22:18 douzujun 阅读(286) 评论(0) 推荐(0) 编辑

python比较两个文本文件是否相同

摘要： import difflib A = open('./file/file01.txt', 'r') B = open('./file/file02.txt', 'r') contextA = A.read() contextB = B.read() s = difflib.SequenceMatch 阅读全文

posted @ 2020-03-09 20:43 douzujun 阅读(4290) 评论(0) 推荐(0) 编辑

2020年3月5日

python将int数据(秒)转化成【时：分：秒】

摘要： seconds = 15743 m, s = divmod(seconds, 60) h, m = divmod(m, 60) print("{0}:{1:02d}:{2:02d}".format(h, m, s)) 4:22:23 阅读全文

posted @ 2020-03-05 21:18 douzujun 阅读(1595) 评论(0) 推荐(0) 编辑

2020年2月29日

python读写入二进制文件

摘要： with open('./file/test.txt', 'wb+') as f: for i in nums: s = struct.pack('i', i) f.write(s) 读： nums = [] with open('./file/2010.txt', 'rb+') as f: for 阅读全文

posted @ 2020-02-29 14:43 douzujun 阅读(2452) 评论(0) 推荐(0) 编辑

2020年2月28日

python去除字符串中空格

摘要： a = " a b c " a.replace(" ", "") Out[210]: 'abc' strip()方法，去除字符串开头或者结尾的空格 a = " a b c " a.strip() Out[212]: 'a b c' 阅读全文

posted @ 2020-02-28 22:17 douzujun 阅读(214) 评论(0) 推荐(0) 编辑

2020年2月26日

统计列表中所有元素出现的频率

摘要： a = "i love love you you" from collections import Counter dict( Counter(list(a.split())) ) Out[103]: {'i': 1, 'love': 2, 'you': 2} 或者： s = '11AAAdfdfB 阅读全文

posted @ 2020-02-26 22:04 douzujun 阅读(410) 评论(0) 推荐(0) 编辑

python统计字符串中每个单词出现的个数【一行】

摘要： s = 'i am very very like you and like you' dict( [(i, s.split().count(i)) for i in s.split()] ) Out[2]: {'i': 1, 'am': 1, 'very': 2, 'like': 2, 'you': 阅读全文

posted @ 2020-02-26 19:43 douzujun 阅读(3940) 评论(0) 推荐(0) 编辑

2020年2月23日

RNN LSTM语言模型

摘要： 1. 语言模型 2. RNN LSTM语言模型 (梯度权重) （1）one to one ：图像分类（2）one to many：图片描述（3）many to one：文本情感分析、分类（4）many to many（N vs M）：Seq2Seq（机器翻译）（5）many to many 阅读全文

posted @ 2020-02-23 11:55 douzujun 阅读(1031) 评论(0) 推荐(0) 编辑

2020年2月22日

NLP入门笔记（一）

摘要： 1. NLP主要范畴 2. NLP涉及知识（计算最大概率的句子） 3. NLTK库(http://www.nltk.org/) 3. 语料及词性标注 4. 分词 5. TF-IDF(统计一篇文章出现频率最高的词) 阅读全文

posted @ 2020-02-22 13:44 douzujun 阅读(238) 评论(0) 推荐(0) 编辑

2020年2月14日

Shell工具【cut/sed/awk/sort】

摘要： 1. cut cut的工作就是“剪”，具体的说就是在文件中负责剪贴数据用的。 cut命令从文件的每一行剪贴字节、字符和字段，并将这些字节、字符和字段输出。 1.1 基本用法 cut [选项参数] filename 说明：默认分隔符是制表符 1.2 选项参数说明 1.3 案例 2. sed 简阅读全文

posted @ 2020-02-14 17:36 douzujun 阅读(382) 评论(0) 推荐(0) 编辑

2020年2月11日

Docker免sudo

摘要： sudo groupadd docker sudo usermod -aG docker $USER 切换到新组 newgrp - docker 重启 sudo service docker restart over 阅读全文

posted @ 2020-02-11 16:04 douzujun 阅读(131) 评论(0) 推荐(0) 编辑

Unable to find image 'hello-world:latest' locally docker: Error response from daemon

摘要：（1）修改 sudo vim /etc/docker/daemon.json （2）添加 { "registry-mirrors": ["https://alzgoonw.mirror.aliyuncs.com"] } 并保存（3）重启 systemctl restart docker sudo 阅读全文

posted @ 2020-02-11 14:57 douzujun 阅读(5311) 评论(0) 推荐(0) 编辑

python爬虫笔记（十）爬虫常见的反爬策略和反爬攻克手段

摘要： 1. 爬虫常见的反爬策略和反爬攻克手段阅读全文

posted @ 2020-02-11 12:51 douzujun 阅读(498) 评论(0) 推荐(0) 编辑

2020年2月9日

python爬虫笔记（九）实例4：前程无忧招聘信息爬虫

摘要： 1. 前程无忧招聘信息爬虫爬取这个网站： http://www.51job.com （设置选项后）分析链接得：https://search.51job.com/jobsearch/search_result.php # -*- coding: utf-8 -*- import requests i 阅读全文

posted @ 2020-02-09 20:42 douzujun 阅读(575) 评论(0) 推荐(0) 编辑

python爬虫实例——阿里云云栖社区博文

摘要：爬取这个网站：https://yq.aliyun.com/articles/ # -*- coding: utf-8 -*- import requests import re import time from parsel import Selector key = "Python" url = 阅读全文

posted @ 2020-02-09 20:29 douzujun 阅读(256) 评论(0) 推荐(0) 编辑

xpath笔记

摘要： 1. 基础 2. 实战阅读全文

posted @ 2020-02-09 13:27 douzujun 阅读(153) 评论(0) 推荐(0) 编辑

2020年2月5日

python爬虫笔记（八）实例3：用Python批量爬取全站小说【以书趣阁为例】

摘要： 1. 用Python批量爬取全站小说爬取这个网站小说：http://www.shuquge.com/txt/89644/index.html 2. 爬取一本书 # -*- coding: utf-8 -*- """ Created on Sat Feb 8 20:31:43 2020 @autho 阅读全文

posted @ 2020-02-05 23:13 douzujun 阅读(1737) 评论(0) 推荐(0) 编辑

2020年2月1日

python爬虫笔记（七）网络爬虫之框架（3）——Scrapy爬虫框架（实例2：股票定向爬虫）

摘要： 1. 股票定向爬虫 2. 实例编写 2.1 建立工程和spider模板（2）配置stocks.py文件 # -*- coding: utf-8 -*- import scrapy import re class StocksSpider(scrapy.Spider): name = 'stocks 阅读全文

posted @ 2020-02-01 17:38 douzujun 阅读(321) 评论(0) 推荐(0) 编辑

python爬虫笔记（七）网络爬虫之框架（2）——Scrapy爬虫框架（实例1）

摘要： 1. 第一个scrapy实例 1.1 建立一个Scrapy爬虫工程 scrapy startproject python123demo 1.2 在工程中产生一个scrapy爬虫（1）生成一个demo的爬虫 scrapy genspider demo python123demo.io 1.3 配置产阅读全文

posted @ 2020-02-01 03:02 douzujun 阅读(322) 评论(0) 推荐(0) 编辑

python爬虫笔记（七）网络爬虫之框架（1）——Scrapy爬虫框架（安装及坑）

摘要： 1. scrapy安装(https://www.osgeo.cn/scrapy/intro/install.html) 建议直接使用anaconda安装，方便快捷，pip安装会遇到很多问题！！！！http://www.scrapyd.cn/doc/124.html conda install -c 阅读全文

posted @ 2020-02-01 01:53 douzujun 阅读(386) 评论(0) 推荐(0) 编辑

conda install安装太慢如何提速

摘要： conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_channel_urls yes 显示全部镜像： conda config --s 阅读全文

posted @ 2020-02-01 01:52 douzujun 阅读(4221) 评论(0) 推荐(0) 编辑

2020年1月31日

python爬虫笔记（六）网络爬虫之实战（2）——股票数据定向爬虫

摘要： 1. 股票数据定向爬虫 https://gupiao.baidu.com/stock http://quote.eastmoney.com/stock_list.html 2. 实例编写 2.1 获取HTML页面 def getHTMLText(url): try: r = requests.get 阅读全文

posted @ 2020-01-31 23:56 douzujun 阅读(922) 评论(2) 推荐(0) 编辑

douzi

公告