cookie的笔记簿

2021年10月20日

摘要： # dtaidistance！！！优选 from dtaidistance import dtw # x query = [1, 1, 2, 3, 2, 0] # y template = [0, 1, 1, 2, 3, 2, 1] dtw.distance(query, template) 1.4 阅读全文

posted @ 2021-10-20 09:28 cookie的笔记簿阅读(468) 评论(0) 推荐(0) 编辑

2021年10月8日

一元二次曲线拟合

摘要：线性拟合 # 导入需要的库 import numpy as np import matplotlib.pyplot as plt from scipy.optimize import leastsq 曲线拟合 1.定义一个目标函数。目标函数是为了方便后面的拟合，操作步骤是：在目标函数上加噪声。【学阅读全文

posted @ 2021-10-08 16:42 cookie的笔记簿阅读(767) 评论(0) 推荐(0) 编辑

2021年10月5日

爬取豆瓣电影top250

摘要：引言为实现豆瓣top50电影在一个Excel表中一览无遗~ 豆瓣电影top250/爬取时间20211005 【存在问题】一次性写入csv存在问题： UnicodeEncodeError: 'gbk' codec can't encode character '\xee' in position 阅读全文

posted @ 2021-10-05 11:17 cookie的笔记簿阅读(211) 评论(0) 推荐(0) 编辑

2021年9月19日

pandasgui

摘要： import pandas as pd from pandasgui import show data = [[1,2,3],[4,5,6],[7,8,9]] data [[1, 2, 3], [4, 5, 6], [7, 8, 9]] df = pd.DataFrame(data,columns= 阅读全文

posted @ 2021-09-19 16:49 cookie的笔记簿阅读(118) 评论(0) 推荐(0) 编辑

2021年8月25日

就业生态解析篇——数据预处理代码部分

摘要：连接爬取到的存储在MySQL种的数据，在该部分不展示。 data = data[data.job_name.str.contains('数据')]# 工作名是否含有数据 # 月薪 import re def salary_deal(text): if '万/月' in text: unit = 10 阅读全文

posted @ 2021-08-25 22:30 cookie的笔记簿阅读(81) 评论(0) 推荐(0) 编辑

2021年8月16日

爬取51job招聘信息（一）

摘要：目标，将网页上的内容爬取下来，并实现翻页，存储为csv。 import os from concurrent.futures.thread import ThreadPoolExecutor from threading import Thread import requests from re i 阅读全文

posted @ 2021-08-16 20:41 cookie的笔记簿阅读(330) 评论(0) 推荐(0) 编辑

2021年6月19日

牛客SQL练习题

摘要：之前的综合题有点难度。这部分是牛客上面的题目，自我总结：简单的一次条件限制的可以轻松写出来；需要进行嵌套的子查询，逻辑不清；有些函数不太知道。 https://www.nowcoder.com/ta/sql 1.查找最晚入职员工的所有信息使用子查询 # 日期相同也无碍 SELECT * F 阅读全文

posted @ 2021-06-19 10:55 cookie的笔记簿阅读(149) 评论(0) 推荐(0) 编辑

2021年6月16日

SQL综合练习（一）

posted @ 2021-06-16 11:38 cookie的笔记簿阅读(54) 评论(0) 推荐(0) 编辑

2021年6月1日

数据探索及数据处理&文本数据的处理（二）

摘要： part1数据探索及数据处理数据处理 # 复制原数据 df3 = df.copy() df3.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3004 entries, 0 to 3003 Data columns (total 7 阅读全文

posted @ 2021-06-01 19:37 cookie的笔记簿阅读(80) 评论(0) 推荐(0) 编辑

数据探索及数据处理&文本数据的处理（一）

摘要： part1数据探索及数据处理数据探索 import pandas as pd # 导入数据集 df = pd.read_excel("~/user_orders.xlsx") # 查看前五行 print('查看前五行:',df.head()) 查看前五行: id name gender age e 阅读全文

posted @ 2021-06-01 16:18 cookie的笔记簿阅读(194) 评论(0) 推荐(0) 编辑