lxinghua

博客园 首页 新随笔 联系 订阅 管理

2023年3月22日 #

摘要: 用户使用行为 1. 为什么要做用户使用行为分析? 用户行为数据时指在产品内进行各种操作产生的数据。比如:访问、浏览和行为事件。每个访问时间可由多个浏览事件和点击事件构成。同样的可以理解为5个元素构成: who、when、 where、 how、 what。 谁在什么时间,什么地点以什么交互方式做了什 阅读全文
posted @ 2023-03-22 15:19 興華 阅读(73) 评论(0) 推荐(0) 编辑

摘要: 4P营销理论 4P营销理论被归结为四个基本策略的组合,即产品(Product)、价格(Price)、渠道(Place)、宣传(Promotion),由于这四个词的英文字头都是P,再加上策略(Strategy),所以简称为“4P’s” 产品:产品是营销组合中第一个和最重要的要素。产品是品牌的载体,是满 阅读全文
posted @ 2023-03-22 14:53 興華 阅读(302) 评论(0) 推荐(0) 编辑

摘要: 常用数据分析方法分类: 数据分析方法有很多种,需要根据业务场景中分析目的的不同,选择对应的分析方法,如果你的分析目的是想将复杂的问题变得简单,就可以使用逻辑树分析方法,例如经典的费米问题就可以用这个分析方法。如果你想分析用户的转化,就要用到漏斗分析方法,录入店铺小周销量下降,想知道中间那个业务环节出 阅读全文
posted @ 2023-03-22 14:22 興華 阅读(23) 评论(0) 推荐(0) 编辑

摘要: 一、什么是数据建模? (1)数据模型,就是在数据层面建立起来的一种逻辑关系的算法集合,该算法集合可以运算未来的同源数据,并产生可预期的结果。通俗说,模型就是算法或公式,如模型y=ax+b,通过该公式,输入x,可以得到y值。通过数据建模输出的模型,就是数据模型。 (2)数据建模是数据分析的一部分,数据 阅读全文
posted @ 2023-03-22 14:03 興華 阅读(1032) 评论(0) 推荐(0) 编辑

2023年3月17日 #

摘要: 为什么要学习scrapy爬虫框架 https://www.runoob.com/w3cnote/scrapy-detail.html 安装scrapy 1. 安装pywin32 -- Microsoft Windows的Python扩展提供对大部分Win32 API的访问,创建和使用COM对象的能力 阅读全文
posted @ 2023-03-17 20:44 興華 阅读(34) 评论(0) 推荐(0) 编辑

2023年3月16日 #

摘要: selenium安装配置 1. 下载对应驱动 安装selenium,需要下载驱动。网址:https://npm.taobao.org/mirrors/chormedriver/ 即需要下载谷歌浏览器当前版本对应的驱动。 2. 解压后得到chromedriver.exe可执行文件 3. 选中这个文件进 阅读全文
posted @ 2023-03-16 20:04 興華 阅读(12) 评论(0) 推荐(0) 编辑

2023年3月15日 #

摘要: GIL锁及多进程 GIL python有一个非常重要的GIL(global interpreter lock,全局解释器锁) python代码执行由python虚拟机(解释器主循环)来控制。对python虚拟机的访问由GIL控制,GIL保证同一时刻只有一个线程在执行。 多进程 由于Python设计的 阅读全文
posted @ 2023-03-15 20:11 興華 阅读(20) 评论(0) 推荐(0) 编辑

摘要: csv存储 1. csv文件时大数据文件储存格式的文件结构与Excel不同; 2. CSV是一种通用、相对简单的文件格式,被用户。商业和科学广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的和/或无规范的格式); 3. 因为大量程序都支持某种CS 阅读全文
posted @ 2023-03-15 20:05 興華 阅读(19) 评论(0) 推荐(0) 编辑

摘要: jaonpath 数据提取 使用普通查找: print(data["store"]["book"][0]["author"] # 找到book下的第一个author 使用jsonpath查找: print(jsonpath.jsonpath(data, "$..author")) # 所有autho 阅读全文
posted @ 2023-03-15 20:04 興華 阅读(19) 评论(0) 推荐(0) 编辑

摘要: requests_html模块 requests_html 模块介绍 1. requests_html是比较新的爬虫库,作者和requests是同一个作者; 2. 我们可以在安装的时候看到他安装了lxml、requests、bs4 ......等我们常用的解析和爬取的库都封装在他里面; 3. 用法和 阅读全文
posted @ 2023-03-15 19:52 興華 阅读(27) 评论(0) 推荐(0) 编辑