摘要:通过hue进行数据导入: 1,create table demo_id(`id` string) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' 2, load data inpath '/user/demo.csv' into table demo_id #sql数据筛选 create table `table_na...
阅读全文
摘要:#pg_sql之增删改查 #修改: inset into table_name (id, name, age, address ) select replace(old_id,old_id,new_id),#old_id字段的old_id数据,替换为new_id replace(name,name,substring(concat('【新名字】'),name),1,20)),#name字段替换...
阅读全文
摘要:附录: chromdriver.exe与chrome版本映射及下载链接 https://blog.csdn.net/mmayanshuo/article/details/78962398
阅读全文
摘要:r = request.get(url)r.status_code 获取响应状态码r.text 获取响应内容r.headers 获取响应头r.encoding 获取响应编码r.content 获取二进制响应内容r.json() 获取JSON响应内容
阅读全文
摘要:r 打开只读文件,该文件必须存在。 r+ 打开可读写的文件,该文件必须存在。 w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。 w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。 a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被...
阅读全文
摘要:Pandas操作 python使用pandas读取csv import pandas as pd #数据筛选 usetTable = pd.read_csv(filename,header = 0) mask = True ^ userTable['ID'].isin(['',''])&..... show = userTable[mask] #例子,包含6105的行 userTable[u...
阅读全文
摘要:特征工程 特征工程是利用数据领域的相关知识来创建能使机器学习达到最佳效果的特征的过程。从数学角度思考,特征工程就是人工地去设计输入变量X。 通常把特征工程看做是一个问题,事实上,在特征工程下面,还有许多子问题,主要包括,特征选择(Feature Selection)、特征提取(Feature Ext
阅读全文
摘要:RFM模型 Recency(距离最近的一次交易),Frequency(交易频率),Monetary(交易金额) (1)是RFM模型? 在客户关系管理的分析模型中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户近期的交易行为、交易的总体频率以及交易金额三项指标来描述该客户的价值状况。依据这三项指标划分8类客户价值。 重要价值客户,重要换回客户,重...
阅读全文