摘要:来自https://blog.csdn.net/sunwukong_hadoop/article/details/80175292 1、Python的继承以及调用父类成员 python子类调用父类成员有2种方法,分别是普通方法和super方法。 假设Base是基类。 普通方法: super方法: 在
阅读全文
摘要:一、回归任务介绍: 拟合一个二元函数 y = x ^ 2. 二、步骤: 三、代码: 导入包: 创建数据 查看数据图像: 构建网络 打印的结果: Net( (hidden): Linear(in_features=1, out_features=10, bias=True) (predict): Li
阅读全文
摘要:目录: Pytorch数据类型:Tensor与Storage 创建张量 tensor与numpy数组之间的转换 索引、连接、切片等 Tensor操作【add,数学运算,转置等】 GPU加速 自动求导:torch.autograd autograd Variable 读取数据集:torch.utils
阅读全文
摘要:1、离线下载: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/ 在清华镜像软件站下载相应的版本,由于我之前安装了cuda8.0以及anaconda3中安装了python3.6,所以选择版本为:pytorch-0.
阅读全文
摘要:摘自https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247486960&idx=1&sn=1b4b9d7ec7a9f40fa8a9df6b6f53bbfb&chksm=96e9d270a19e5b668875392da1d1aaa28ff
阅读全文
摘要:摘自:https://blog.csdn.net/me_yundou/article/details/80459341 具体看上面链接 一、摘要: 这篇文章主要介绍的是作者识别(author identification)问题。作者识别问题是指基于某个T时间之前的所有论文(paper)和它们的作者(
阅读全文
摘要:目录 有效的括号字符串(1) 有效的括号字符串(2) 有效的括号字符串(3)【三种题型】 括号最长有效长度 括号的分数(LeetCode856) 括号生成(LeetCode22) 字符串解码,去除括号(python) 括号匹配判断 题目、有效的括号字符串(1):【两个栈】 给定一个只包含三种字符的字
阅读全文
摘要:一、摘要 本文提出一种方法,将神经语言模型应用在用户购买时间序列上,将产品嵌入到低维向量空间中。结果,具有相似上下文(即,其周围购买)的产品被映射到嵌入空间中附近的向量。 二、模型: 低维项目向量表示: 1、prod2vec: 给定当前产品pi,观察到邻居产品p i+j的概率为P(p i+j | p
阅读全文
摘要:一、题目:在二叉树中找到累加和为指定值的最长路径长度 给定一棵二叉树的头节点head和一个32位整数sum,二叉树节点值类型为整型,求累加和为sum的最长路径长度。路径是指从某个节点往下,每次最多选择一个孩子节点或者不选所组成的节点链。 采用两个递归思路:时间复杂度O(N2),空间复杂度O(1) 代
阅读全文
摘要:一、摘要: 本文模型 LRML(潜在相关度量学习)是一种新的度量学习方法的推荐。【旨在学习用户和项目之间的相关关系,而不是简单的用户和项目之间的push和pull关系,push和pull主要针对LMNN算法】 为了做到这一点,本文采用了一个增强的存储器模块,并通过这些记忆块来构建用户和项目潜在的关系
阅读全文
摘要:一、摘要: 主要是做一个基于协作(深度)度量学习(CML)的系统来预测新剧场版本的购买概率。即测量产品的空间距离来预测购买概率。 二、模型 该图分为两部分,先计算右边,右边通过深度度量学习(DDML)来计算产品距离,将得到的产品距离输入左边逻辑回归中得到购买概率。 e(movie)是电影的词向量,f
阅读全文
摘要:一、摘要: 文章的核心思想:是如何把Metric learning 和 CF结合起来从而达到更好的推荐效果。 提出了CML(Collaborative Metric Learning),其学习一个联合度量空间,不仅编码用户的偏好,而且编码用户-用户和项目-项目的相似性。 假设用户和物品可以放到低维空
阅读全文
摘要:时间/空间复杂度分析 时间复杂度均为O(n);空间复杂度平均情况下为O(logn),最坏情况下为O(n). Morris遍历:时间为O(n),空间为O(1) 一、前序遍历: 递归方式: 非递归方式:时间复杂度O(n),空间复杂度O(n) 二、中序遍历: 递归方式: 非递归方式: 三、后序遍历: 递归
阅读全文
摘要:1、将时间字符串解析成真正的时间 time.strptime http://www.runoob.com/python/att-time-strptime.html 代码:
阅读全文
摘要:一、题目:合并两个有序的单链表 思路:时间复杂度O(M+N),空间复杂度O(1) 简单来说就是在原来的链表上采用三个指针来操作两个链表。 若是合并两个无序链表成有序链表,先将两个链表用冒泡或快排等方法排序,再合并。 代码: 二、题目:按照左右半区的方式重新组合单链表 思路:时间复杂度O(N),空间复
阅读全文
摘要:如果想在节点之间共享一份变量,spark提供了两种特定的共享变量,来完成节点之间的变量共享。 (1)广播变量(2)累加器 二、广播变量 概念: 广播变量允许程序员缓存一个只读的变量在每台机器上,而不是每个任务保存一个拷贝。例如,利用广播变量,我们能够以一种更有效率的方式将一个大数据量输入集合的副本分
阅读全文
摘要:1、交叉表(crosstab): pandas中也有,常和pivot_table比较。 查看家庭ID与评分的交叉表: 2、处理缺失值:fillna withColumn:新增一列数据 cast : 用于将某种数据类型的表达式显式转换为另一种数据类型 将缺失值删除:dropna 3、处理重复值 查看有
阅读全文
摘要:1、读取: sparkDF = spark.read.csv(path) sparkDF = spark.read.text(path) 2、打印: sparkDF.show()【这是pandas中没有的】:打印内容 sparkDF.head():打印前面的内容 sparkDF.describe()
阅读全文
摘要:一、摘要: 背景:会话组推荐系统的一个主要挑战是如何适当地利用群组成员之间的交互引起用户偏好,这可能会偏离用户的长期偏好。长期偏好和群组诱导的偏好之间的相对重要性应该根据具体的群组设置而变化。 本文:通过实验,结论:当群组讨论对群组成员的喜好没有影响时,长期偏好占有更大权重。而当群组上下文促使成员有
阅读全文
摘要:一、map操作,map(Transform) 二、collect操作,collect(Action) 三、使用PairRDD来做计算,类似key-value结构 采用groupByKey来。将资料按照Key值重新排序。 更好的解决方案:reduceByKey(Transform) reduceByK
阅读全文
摘要:来源EDB2018 EDB 一、摘要: 组推荐是将一种项目(例如产品、服务)推荐给由多个成员组成的组的方法。 最小痛苦法(least Misery)是一种具有代表性的群体推荐方法,其能够推荐考虑群体不满意的项目,但存在推荐准确率低的缺点。 均值法推荐精度较高,但是不能考虑群体的不满意项目。 本文提出
阅读全文
摘要:别人的相关代码文件:https://github.com/bryanyang0528/hellobi/tree/master/pyspark 1、启动spark (1)SparkSession 是 Spark SQL 的入口。 (2)通过 SparkSession.builder 来创建一个 Spa
阅读全文
摘要:1、确保已经安装jdk和anaconda3。【我安装的jdk为1.8,anaconda的python为3.6】 2、安装spark,到官网 http://spark.apache.org/downloads.html 上下载,我下载的是spark-2.3.1-bin-hadoop2.7.tgz。 (
阅读全文
摘要:一、题目:两个单链表相交的一系列问题 思路: 1、首先分别判断两个链表是否有环。如果一个有环,一个无环,则表明肯定不相交。 思路:设置两个指针,一个慢slow【每次只走一步】,一个快fast【每次走两步】,如果快的走完全程,即走到None,则表示没有环,如果两个指针一直走下去,且存在slow = f
阅读全文
摘要:1、安装python 2、安装jdk 3、下载spark:http://spark.apache.org/downloads.html, 下载新版(spark-2.3.1-bin-hadoop2.7.tar) 4、解压到合适的目录,我放在了/usr/lyl/spark下,采用的命令为:tar zxv
阅读全文
摘要:1、将tgz文件解压到指定目录: # tar zxvf test.tgz -C 指定目录 比如将 /lyl/test.tgz解压到 /lyl/linux 目录下 # tar zxvf /lyl/test.tgz -C /lyl/linux 2、删除正则匹配的文件 比如 home下面有我备份的文件压缩
阅读全文
摘要:1、报错 参考:https://stackoverflow.com/questions/47633870/rpm-lib64-liblzma-so-5-version-xz-5-1-2alpha-not-found-required-by-lib-li centos7中默认python版本为2,故安
阅读全文
摘要:一、题目:将单向链表按某值划分为左边小、中间相等、右边大的形式 简单的思路:时间O(N),空间O(N) 采用一个数组来存储链表中的值,然后对该数组进行快排,然后再连成链表,快排思想如下图所示: 代码: 进阶思想:时间O(N),空间O(1) 代码: 二、题目:实现单链表的选择排序: 要求:额外空间为O
阅读全文
摘要:一、题目:判断一个链表是否为回文结构 简单思路:时间O(N),空间O(N) 采用栈来存储链表值,再从栈中弹出值(逆序),如果和链表顺序值一样,则为回文结构。 eg:1→2→1,顺序:121,倒序:121。则为回文。 1→3→2,顺序:132,倒序:231,不为回文。 代码: 空间省一半的思路:时间O
阅读全文
摘要:1、题目:环形单链表的约瑟夫问题 普通思路:时间复杂度O(n × m) 代码: 题目思路:时间O(n): 每隔m个删除,超过n的大小,则取余来删除。 递归思路: 从1人环的0计算到10人环,结果为4。转化公式: 由图知,10人环中最后入海的是4号,现由其在1人环中的对应编号0来求解。 公式:其中,m
阅读全文
摘要:1、在anaconda网站下载安装包: 清华镜像网站:https://repo.continuum.io/archive/index.html 2、下载最新版本为python3 ,Linux64位的: Anaconda3-5.3.0-Linux-x86_64.sh 3、采用命令将sh 文件上传到服务
阅读全文
摘要:1、题目:反转单链表或双链表 要求:如果链表长度为N,时间复杂度为O(N),额外的空间复杂度为O(1) 反转单链表的思路: 1 → 2 → 3 → 4 → 5 (1)first = head = 1 循环: temp = head.next 2 head.next = temp.next 1 → 3
阅读全文