Python中split()方法的使用

摘要: Python split() 方法通过指定分隔符对字符串进行分割并返回一个列表,默认分隔符为空字符,包括空格,换行(\n),制表符(\t)等 str.split() 默认以空格,换行(\n),制表符\t分割 str.split('字符串'):以字符串为分割 str.split('字符串',2)分割以 阅读全文
posted @ 2019-11-03 12:59 一颗西蓝花 阅读(3317) 评论(0) 推荐(0) 编辑

03 数据分析基础

摘要: 一、数据分析 本章 9 种数据分析方法:对比分析、多维度拆解、漏斗观察、分布情况、用户留存、用户画像、归因查找、路径挖掘、行为序列 二、如何进行对比分析 2.1 比什么 注意: (1)只看绝对值,不知道问题的严重程度 (2)易受到极端值影响 2.2 怎么比 (1)环比:与当前时间范围相邻的上一个时间 阅读全文
posted @ 2019-07-20 18:26 一颗西蓝花 阅读(247) 评论(0) 推荐(0) 编辑

05 连接内容与人

摘要: 作为连接内容与人的推荐系统,每时每刻都在面对增量的问题: - 增量的用户 - 增量的内容 一、内容冷启动 背景: (1)新的内容对推荐系统而言,是没有信息量积累的,需要积累一定的曝光量和互动量(阅读、分享等)来收集足够的信息 (2)从0到1积累基础数据的过程就是冷启动 (3)因此,如何从0到1就是我 阅读全文
posted @ 2019-07-19 18:57 一颗西蓝花 阅读(127) 评论(0) 推荐(0) 编辑

03 推荐算法:物以类聚,人以群分

摘要: 理解了内容和用户的基础特征之后,进一步探讨推荐算法是如何匹配用户和内容的。这一过程,可以理解为: - 物以类聚 - 人以群分 一、物以类聚:基于内容属性的相似性推荐 二、人以群分:基于用户行为的协同过滤 阅读全文
posted @ 2019-07-19 18:11 一颗西蓝花 阅读(246) 评论(0) 推荐(0) 编辑

02 推荐的起点:断物识人

摘要: 推荐系统的本质,就是将人与内容连接起来,在这个过程中,一共有 2 个主体,一个是人一个是内容。 因此,如何更好的了解人,如何更好的了解内容,是本次我们尝试了解的重点,即: 断物识人 一、断物 要要内容推荐给人,首先需要充分理解内容的特点是什么。 因此,就是我们“断物”的话题了。而断物最简单的方式是“ 阅读全文
posted @ 2019-07-19 15:32 一颗西蓝花 阅读(317) 评论(0) 推荐(0) 编辑

01 走进内容推荐

摘要: 在本章,主要是了解一下推荐系统框架,接着我们会看一下YouTube和Netflix的推荐系统,看一下工业上的应用是如何做的,以及如何优化。 在开始介绍推荐系统框架之前,我们先思考一个问题。 🤔搜索和推荐的关系和区别? 为什么需要思考这个问题呢?因为用户接触得更早的是搜索,推荐是后期发展出来的。同时 阅读全文
posted @ 2019-07-19 15:20 一颗西蓝花 阅读(134) 评论(0) 推荐(0) 编辑

相关系数和代码实现

摘要: 统计学上有 3 种相关系数: 一、皮尔逊相关 阅读全文
posted @ 2019-07-18 23:56 一颗西蓝花 阅读(424) 评论(0) 推荐(0) 编辑

统计学相关系数以及其代码实现

摘要: 统计学上主要有 3 大相关系数: 一、皮尔逊相关系数 1. 原理 2. 代码实现 二、斯皮尔曼相关系数 三、肯德尔相关系数 参考文章: 1. https://www.cnblogs.com/HuZihu/p/10183502.html 2. https://blog.csdn.net/ichuzhe 阅读全文
posted @ 2019-07-18 23:50 一颗西蓝花 阅读(555) 评论(0) 推荐(0) 编辑