摘要:
pandas,numpy数据处理分析常用方法 有空时将持续补充并完善相关说明 pandas读取各类数据库 pandas读存csv csv大文件读取(utf-8) path:文件路径 chunksize:文件分区大小(加速读取) 返回:pandas dataframe def read_file(pa 阅读全文
摘要:
首先你要有自己的代理端口 ss v二ray 之类。 git上下载 proxychains git clone https://github.com/rofl0r/proxychains-ng 编译安装 yum install gcc cd proxychains-ng ./configure --p 阅读全文
摘要:
当GET和PUT请求成功时,要返回对应的数据,及状态码200,即SUCCESS 当POST创建数据成功时,要返回创建的数据,及状态码201,即CREATED 当DELETE删除数据成功时,不返回数据,状态码要返回204,即NO CONTENT 当GET 不到数据时,状态码要返回404,即NOT FO 阅读全文
摘要:
设置es所有索引的最大返回数为1000万。 可替换为指定索引 阅读全文
摘要:
用户+密码+随机数+当前时间戳 md5加密 阅读全文
摘要:
`w = df.groupBy(window("date", "5 seconds")).agg(sum("val").alias("sum"))` 移动窗口 `data1 = data.groupBy(window(data.date,"3 days","1 days"),data.column2 阅读全文
摘要:
PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS='notebook' ./bin/pyspark 阅读全文
摘要:
1.使用pip清华镜像 确保pip版本大于10.0.0,若版本较低先升级版本 升级pip 切换到清华源 2.若依旧超时,可修改默认超时时间 `pip default timeout=100 install U Pillow` 阅读全文
摘要:
hyy.py导航 read_din(ids,timea=90000000) 读取0.92 oracle中的最新9000000s din数据 read_din2(ids,timea,line=602000) 读取0.92 oracle中指定天的数据 charu(result,value,value2, 阅读全文
摘要:
`True` 阅读全文