摘要:
“人人都要成为数据分析师”并不是空谈,而是随着大数据时代的到来,产业逐渐向数据驱动模式转型的必然趋势。每个行业和岗位都需要通过数据来指导决策和优化流程,这意味着每个人都要具备一定的分析能力。随着技术的发展,越来越多的简单易用工具被开发出来,使得数据分析不再仅仅是专业数据人员的专属领域。尽管数据分析在 阅读全文
摘要:
统计学习是一门通过数据建模和分析进行预测的重要学科,其核心依赖于数据的统计规律性。为帮助读者更好地理解统计学习中的关键问题和术语,这里集成阐述了一些容易被忽视或误解的概念。例如,自由度、方差的无偏估计和置信区间,这些术语在统计学习中至关重要,但常常让初学者感到困惑。 一、五人法则 五人法则是一个简单 阅读全文
摘要:
在现代社会,数据被喻为“新石油”,它已成为经济、科技、医疗等众多领域的重要资源,我们可以将数据看作统计的“原料”,正如美食烹饪中的食材。数据不仅是我们进行分析的基础,更是探寻世界规律、解决复杂问题的关键要素与切入口。在统计学中数据可以被视为研究现象、进行分析的最基本单元。统计学的核心任务是通过数据来 阅读全文
摘要:
在现代社会,统计学已不仅仅是经济管理类课程中的重要组成部分,更成为了每个人在日常生活与工作中不可或缺的一项基本技能。随着数据时代的到来,无论是在工作场合还是日常决策中,统计学都能帮助我们从大量的数据信息中提炼出有价值的见解。在商业领域,企业通过统计分析来预测市场趋势、分析消费者行为,从而制定更加精准 阅读全文
摘要:
提到弗朗西斯·高尔顿,人们通常会联想到他的钉板实验(也称为高尔顿板),以及他作为查尔斯·达尔文的表弟的身份。然而,弗朗西斯·高尔顿的贡献远远不止于此,他是维多利亚时代的集大成者,横跨多个领域:人类学、统计学、心理学、遗传学、地理学、发明学和气象学,同时也是一位热带探险家和地理学家。他的广泛兴趣和跨学 阅读全文
摘要:
日期时间是一类独特的数据,在实际中有众多的应用。R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。 ###一、ISO 8601标准的日期和时间 使用使用ISOdate(),创建IS 阅读全文
摘要:
AARRR模型可以说是用户运营和业务增长非常重要的模型。模型以用户的生命周期为核心,把增长步骤拆分为5个步骤,分别是:获取用户(Acquisition)、用户激活(Activiation)、用户留存(Retention)、用户变现(Revenue)、用户推荐(Referal)。区别于传统的市场营销人 阅读全文
摘要:
在2010年,互联网创业者增长黑客之父肖恩·埃利斯(Sean Ellis)就创造了增长黑客(Growth hacker)这样一个概念。2015年,范冰撰写的一本新书《增长黑客》确立了Growth hacker的概念,同时引进了AARRR(增长黑客理论)基本模型,通常采用的手段包括A/B测试,搜索引擎 阅读全文
摘要:
RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。RFM是一种综合评分的分类模型,由于其计算简单方便,在众多的客户细分模型 阅读全文
摘要:
在R语言中,tidyr主要提供了一个类似Excel中数据透视表 (pivottable)的功能; gather和spread函数将数据在长格式和宽格式之间相互转化,应用在比如稀疏矩阵和稠密矩阵之间的转化; separate和union方法提供了数据分组拆分、合并的功能,应用在nominal数据的转化 阅读全文