随笔分类 -  外训

摘要:布隆过滤器 概念 布隆过滤器是概率型数据结构,由一个二进制向量和一系列随机映射函数组成。它可以用于检索一个元素是否在一个集合中。 实现过程 1. 定义向量长度,并赋初值为0. 2. 定义N个hash函数,并指定个数(1,N) 3. 将需要存储的值经过n个hash计算得出的值作为key来修改向量的值( 阅读全文
posted @ 2020-01-09 12:01 巫小诗 阅读(183) 评论(0) 推荐(0) 编辑
摘要:一、numpy 什么是numpy,一个高性能的科学计算和数据分析基础包,和numpy,matplotlib并称数学三剑客 开胃菜 numpy常用的方法 array 将列表转成数组 arange('start','end','step') 相当于python的range()函数,顾头不顾尾 linsp 阅读全文
posted @ 2019-06-20 23:28 巫小诗 阅读(247) 评论(0) 推荐(0) 编辑
摘要:```python import requests from bs4 import BeautifulSoup import datetime import pandas as pd import matplotlib.pyplot as plt import re import jieba import numpy as np from wordcloud i... 阅读全文
posted @ 2019-06-20 23:28 巫小诗 阅读(264) 评论(0) 推荐(0) 编辑
摘要:爬虫系列 什么是爬虫?都有哪些爬虫?我学了爬虫要找什么样的工作?工资有多少? 网络爬虫(又被称为网页 "蜘蛛" ,网络机器人,在 "FOAF" 社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取 "万维网" 信息的程序或者脚本。 爬虫一般分为通用爬虫和聚焦爬虫。 一般是需要找爬虫工 阅读全文
posted @ 2019-06-19 00:13 巫小诗 编辑
摘要:day03 selenium 介绍 Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11), "Mozilla Firefox" ,Safari,Google Chrome,Ope 阅读全文
posted @ 2019-06-19 00:13 巫小诗 阅读(203) 评论(0) 推荐(0) 编辑
摘要:手牵手带你走进python圈 什么是python?python能干什么? Python是由Guido van Rossum于1989年底发明的一种解释型、面向对象、动态数据类型的高级程序设计语言。 python可以做 web全栈 , 人工智能 , 机器学习 , 爬虫开发 , 数据分析 , 游戏开发 阅读全文
posted @ 2019-06-19 00:12 巫小诗 编辑

点击右上角即可分享
微信分享提示