2021年4月13日
摘要: 一、基本概念复习 1、自编码器 输入等于输出的神经网络模型 全连接层神经网络组成的最简单的自编码器只有三层结构,中间的隐藏层才是需要关注的地方。 在训练过程中,输入经过编码再解码,还原成原来的样子。 假如通过一组数据训练出了自编码器,拆掉解码器后,就可以使用编码器来表征数据了。 隐藏层的神经元数目远 阅读全文
posted @ 2021-04-13 22:13 三分天涯 阅读(214) 评论(0) 推荐(0) 编辑
  2021年4月12日
摘要: 一、快速理解GNN {1,1,1,1,1}代表特征 GNN有三种操作: 1 聚合:BCD的特征可以在一定程度上决定A的类别。经过一次聚合后,邻居信息N=b*{2,2,2,2,2}+c*{3,3,3,3,3}+d*{4,4,4,4,4},bcd是训练出的或者手动设置的(常作为文章的改进点,比如B很重要 阅读全文
posted @ 2021-04-12 14:03 三分天涯 阅读(237) 评论(0) 推荐(0) 编辑
  2020年12月28日
摘要: 一、keras基础 keras效率比tensorflow慢。 pip install keras==2.2.5 ,对应tensorflow 1.14.0 import keras 出现 Using TensorFlow backend. 说明安装成功。 1、线性回归 import keras imp 阅读全文
posted @ 2020-12-28 22:12 三分天涯 阅读(269) 评论(0) 推荐(0) 编辑
  2020年10月22日
摘要: 视频链接:https://www.bilibili.com/video/BV1dT4y177KA?from=search&seid=12868977424779984308 1、git找到源码下载,在pycharm打开。 2、先看readme,安装所需要的环境,pip install。 3、在pyc 阅读全文
posted @ 2020-10-22 19:13 三分天涯 阅读(7050) 评论(0) 推荐(1) 编辑
  2020年10月12日
摘要: 时空大数据至少带有三个信息:用户id,时间,空间 一、出租车OD提取 1、读取数据 csv格式:Excel最多支持104万行,如果超过这个打开Excel再保存,就会丢失数据。 import pandas as pd #读取数据 data = pd.read_csv(r'data-sample/Tax 阅读全文
posted @ 2020-10-12 20:42 三分天涯 阅读(812) 评论(0) 推荐(1) 编辑
  2020年9月10日
摘要: 1、在图形化界面创建新环境tf1,选择python版本3.7 activate tf1 2、安装依赖包 python -m pip install html5lib bleach ipykernel python -m pip install --ignore-installed --upgrade 阅读全文
posted @ 2020-09-10 11:14 三分天涯 阅读(574) 评论(0) 推荐(0) 编辑
  2020年9月9日
摘要: 一、introduction How do we utilize the structures and relationship to help our model? What if the graph is larger, like 20k nodes? What if we don‘t have 阅读全文
posted @ 2020-09-09 15:31 三分天涯 阅读(867) 评论(0) 推荐(0) 编辑
  2020年9月8日
摘要: 一、transfer learning target data:现在要考虑的task直接相关。 source data:和现在要考虑的task没有直接关系。 四种可能:有label和无label。 二、fine-tuning target data和source data同时都有label。 tar 阅读全文
posted @ 2020-09-08 12:25 三分天涯 阅读(478) 评论(0) 推荐(0) 编辑
  2020年7月9日
摘要: 一、半监督学习 1、定义 unlabeled的数量远大于labeled的数量。 半监督学习分为直推学习(用了训练集的feature)和归纳学习(手上没有测试集)。 人类也一直在做半监督学习。 没有标签的数据(灰色点)的分布会影响划分。半监督学习有没有用取决于假设是否符合实际。 2、生成模型中的半监督 阅读全文
posted @ 2020-07-09 01:14 三分天涯 阅读(682) 评论(0) 推荐(0) 编辑
  2020年7月2日
摘要: 一、问题提出 slot filling(槽填充):智慧客服、智慧订票系统中往往需要自动将词汇与slot对应。 把词汇用向量表示。 多加一个other维度,不在词典中就归类到other。 也可以用一个词汇的字母的n-gram,如apple中包含app、ppl、ple。 把这个vector放进netwo 阅读全文
posted @ 2020-07-02 20:11 三分天涯 阅读(873) 评论(0) 推荐(0) 编辑