懵懂的菜鸟

Stay hungry,Stay foolish.

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

随笔分类 -  数据科学与数据分析

HUE-hive常用查询语句整理
摘要:通过hue进行数据导入: 1,create table demo_id(`id` string) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' 2, load data inpath '/user/demo.csv' into table demo_id #sql数据筛选 create table `table_na... 阅读全文

posted @ 2019-05-11 00:07 懵懂的菜鸟 阅读(5312) 评论(0) 推荐(0) 编辑

pg_sql常用查询语句整理
摘要:#pg_sql之增删改查 #修改: inset into table_name (id, name, age, address ) select replace(old_id,old_id,new_id),#old_id字段的old_id数据,替换为new_id replace(name,name,substring(concat('【新名字】'),name),1,20)),#name字段替换... 阅读全文

posted @ 2019-05-11 00:03 懵懂的菜鸟 阅读(1788) 评论(0) 推荐(0) 编辑

python 爬取媒体文件(使用chrome代理,启动客户端,有防火墙)
摘要:附录: chromdriver.exe与chrome版本映射及下载链接 https://blog.csdn.net/mmayanshuo/article/details/78962398 阅读全文

posted @ 2019-05-11 00:01 懵懂的菜鸟 阅读(726) 评论(0) 推荐(0) 编辑

python 爬取媒体文件(无防火墙)
摘要:r = request.get(url)r.status_code 获取响应状态码r.text 获取响应内容r.headers 获取响应头r.encoding 获取响应编码r.content 获取二进制响应内容r.json() 获取JSON响应内容 阅读全文

posted @ 2019-05-10 23:58 懵懂的菜鸟 阅读(523) 评论(0) 推荐(0) 编辑

python读写符号的含义
摘要:r 打开只读文件,该文件必须存在。 r+ 打开可读写的文件,该文件必须存在。 w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。 w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。 a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被... 阅读全文

posted @ 2019-05-10 23:57 懵懂的菜鸟 阅读(1135) 评论(0) 推荐(0) 编辑

python数据分析开发中的常用整理
摘要:Pandas操作 python使用pandas读取csv import pandas as pd #数据筛选 usetTable = pd.read_csv(filename,header = 0) mask = True ^ userTable['ID'].isin(['',''])&..... show = userTable[mask] #例子,包含6105的行 userTable[u... 阅读全文

posted @ 2019-05-10 23:56 懵懂的菜鸟 阅读(1064) 评论(0) 推荐(0) 编辑

特征工程
摘要:特征工程 特征工程是利用数据领域的相关知识来创建能使机器学习达到最佳效果的特征的过程。从数学角度思考,特征工程就是人工地去设计输入变量X。 通常把特征工程看做是一个问题,事实上,在特征工程下面,还有许多子问题,主要包括,特征选择(Feature Selection)、特征提取(Feature Ext 阅读全文

posted @ 2019-05-10 23:42 懵懂的菜鸟 阅读(245) 评论(0) 推荐(0) 编辑

RFM模型
摘要:RFM模型 Recency(距离最近的一次交易),Frequency(交易频率),Monetary(交易金额) (1)是RFM模型? 在客户关系管理的分析模型中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户近期的交易行为、交易的总体频率以及交易金额三项指标来描述该客户的价值状况。依据这三项指标划分8类客户价值。 重要价值客户,重要换回客户,重... 阅读全文

posted @ 2019-05-10 23:37 懵懂的菜鸟 阅读(453) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示