摘要: pandas,numpy数据处理分析常用方法 有空时将持续补充并完善相关说明 pandas读取各类数据库 pandas读存csv csv大文件读取(utf-8) path:文件路径 chunksize:文件分区大小(加速读取) 返回:pandas dataframe def read_file(pa 阅读全文
posted @ 2020-11-25 17:22 我不做人了jojo 阅读(312) 评论(0) 推荐(0) 编辑
摘要: 首先你要有自己的代理端口 ss v二ray 之类。 git上下载 proxychains git clone https://github.com/rofl0r/proxychains-ng 编译安装 yum install gcc cd proxychains-ng ./configure --p 阅读全文
posted @ 2020-06-11 15:58 我不做人了jojo 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 当GET和PUT请求成功时,要返回对应的数据,及状态码200,即SUCCESS 当POST创建数据成功时,要返回创建的数据,及状态码201,即CREATED 当DELETE删除数据成功时,不返回数据,状态码要返回204,即NO CONTENT 当GET 不到数据时,状态码要返回404,即NOT FO 阅读全文
posted @ 2019-11-13 14:19 我不做人了jojo 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 设置es所有索引的最大返回数为1000万。 可替换为指定索引 阅读全文
posted @ 2019-11-11 14:26 我不做人了jojo 阅读(2182) 评论(0) 推荐(0) 编辑
摘要: 用户+密码+随机数+当前时间戳 md5加密 阅读全文
posted @ 2019-11-08 10:18 我不做人了jojo 阅读(109) 评论(0) 推荐(0) 编辑
摘要: `w = df.groupBy(window("date", "5 seconds")).agg(sum("val").alias("sum"))` 移动窗口 `data1 = data.groupBy(window(data.date,"3 days","1 days"),data.column2 阅读全文
posted @ 2019-09-05 11:02 我不做人了jojo 阅读(400) 评论(0) 推荐(0) 编辑
摘要: PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS='notebook' ./bin/pyspark 阅读全文
posted @ 2019-09-04 16:06 我不做人了jojo 阅读(328) 评论(0) 推荐(0) 编辑
摘要: 1.使用pip清华镜像 确保pip版本大于10.0.0,若版本较低先升级版本 升级pip 切换到清华源 2.若依旧超时,可修改默认超时时间 `pip default timeout=100 install U Pillow` 阅读全文
posted @ 2019-08-26 16:17 我不做人了jojo 阅读(367) 评论(1) 推荐(0) 编辑
摘要: hyy.py导航 read_din(ids,timea=90000000) 读取0.92 oracle中的最新9000000s din数据 read_din2(ids,timea,line=602000) 读取0.92 oracle中指定天的数据 charu(result,value,value2, 阅读全文
posted @ 2019-08-26 10:17 我不做人了jojo 阅读(194) 评论(0) 推荐(0) 编辑
摘要: `True` 阅读全文
posted @ 2019-08-06 16:18 我不做人了jojo 阅读(7412) 评论(0) 推荐(0) 编辑