摘要:
安装vscode: 问题,config的路径带中文(win系统用户名设置为中文了)导致密码一直输入错误,解决方法: 1.下载安装git 2.将XXX/Git/usr/bin的路径添加到系统变量中的path中,且位置高于win自带的ssh路径。 在链接时会出现问题,Error: Running the 阅读全文
摘要:
参考链接:https://my.oschina.net/kyo4321/blog/1587881 ###将libsvm转为dataframe from sklearn.datasets import load_svmlight_file from pandas import DataFrame im 阅读全文
摘要:
后台运行程序 nohup python test.py > log.txt & 查看后台运行程序 ps -ef | grep python 或者htop 按照端口号强制关闭运行程序 kill -s 9 端口号 查看 前几行 ,后几行 head - n 行数 文件 tail 从第n行开始显示,m行 c 阅读全文
摘要:
import flask,json from flask import request,make_response from flask_cors import * #创建一个服务,把当前这个python文件当做一个服务 server = flask.Flask(name) #为跨域访问设置 COR 阅读全文
摘要:
参考链接: https://www.jianshu.com/p/2857638f039d https://www.cnblogs.com/wangjian941118/p/13824511.html 问题:在linux上没有root的权限,无法安装包,需要采用virtualenv构建虚拟环境(管理员 阅读全文
摘要:
由https://www.bilibili.com/video/BV1aE411o7qd?p=12与https://www.bilibili.com/video/BV1aE411o7qd?p=12总结得到 线性回归的思维导图如下: 阅读全文
摘要:
互联网中的图数据: 社交关系、知识图谱、行为关系图 基于图数据的 Graph Embedding 方法: 1基于随机游走的Graph Embedding 方法(注意:DeepWalk 的跳转概率就是跳转边的权重占所有相关出边权重之和的比例): 2.同质性与结构性权衡的方法,Node2Vec: 同质性 阅读全文
摘要:
embedding:用一个数值向量表示一个对象的方法,主要用以表示对象之间的关系 重要性: 1.将高维稀疏特征转为低维稠密特征。 2.融合大量有价值的信息,表达能力强。 以下为word2vector的模型结构(输入词的 one-hot编码,拟合该词的muti-hot编码,利用反向传播,激活函数是so 阅读全文
摘要:
Spark架构图如下: Spark 的计算过程:Stage内部数据高效并行计算,Stage边缘处进行消耗资源的shuffle或者reduce操作。 特征处理方法: 1.类别特征:one-hot编码 2.数值特征:归一化(不同类别特征权重不统一)与分桶(解决特征值分布不均与,过程:特征值高低排序->分 阅读全文
摘要:
下图是特征工程在推荐系统中的位置: 推荐系统常用的特征: 1.用户行为数据:显性反馈与隐性反馈(容易获得)。 2.用户关系数据:强关系(好友)和弱关系(有点关系)。 3.属性与特征数据:一般先用muti-hot编码,再进行embedding,目前业界大多先构建属性与主体之间的知识图谱,再进行embe 阅读全文