摘要: 上图可知:python中的切片操作都是深拷贝。 那么,下面图中问题也知道了,因为b是深拷贝,所以b变化了,a不变换,很正常。 阅读全文
posted @ 2021-11-12 19:57 踏浪前行 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 1、举例从以前的错误得到反思的过程。 2、弱人工智能,强人工智能,图片识别算不算是真正意义上的人工智能? 3、技术改变世界,你想如何改变? 4、技术对社会影响的负面效果,举例。 5、描述一下之前的公司。 6、对于算法的理解。 如果真正做算法,去加一些东西,提高算法的效率,或者一种完全新的模型,这其实 阅读全文
posted @ 2021-10-16 16:53 踏浪前行 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 一直插入排序和选择排序弄混掉,这里解释以下 因为插入排序是稳定的,选择排序是不稳定的 这里有两张图片就可以表示 阅读全文
posted @ 2021-10-10 14:23 踏浪前行 阅读(91) 评论(0) 推荐(0) 编辑
摘要: RNN的符号表示,序列样本,序列内部表示,生成y表示,Tx表示输入长度,Ty表示输出长度。 用到的one-hot编码 RNN的动机来源:1、原始的神经网络,输入输出都是一个固定长度,但是序列是不定长度的,所以有了水平的时间方向的RNN 2、原始的神经网络没有体现出句子中位置的关系 如下图,左边是简单 阅读全文
posted @ 2021-10-09 22:49 踏浪前行 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 1、onehot 缺点:词之间没有关联,泛化性差 2、高维特征表示:每词由300维的特征表示,能够获取词之间的相似性关系。更好。 学习词嵌入,可以迁移学习,可以小样本 在训练集中找相似特征的进行归纳。 一般词嵌入,使用双向RNN 词嵌入,找网上模型然后少量训练标记进行迁移学习,可以使用比1-hot更 阅读全文
posted @ 2021-10-09 22:49 踏浪前行 阅读(251) 评论(0) 推荐(0) 编辑
摘要: RNN新生成序列采样,这样做的动机:因为要看训练好的模型不知道在那些方面表现的好,具体来分析,便于进一步改进模型。数学角度说,就是检查训练好的数据分布是怎样的。 具体来说: 1、按照生成模型那样,先生成第一个单词,softmax分布进行随机抽选,第二个词在第一个词的基础上进行生成,第三个在前两个词的 阅读全文
posted @ 2021-10-09 20:25 踏浪前行 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 举例说明维度的高低会影响数据的预测: 二维空间中随机两点的平均距离为0.52,三维空间中随机两点的平均距离为0.66,100万维的空间中随机两点的平均距离维408.25 也就意味着无限大的高维空间是非常稀疏的,非常容易过拟合,所以预测是极不稳定的,因此我们有降维的需求。 当然,我们应该明白,不是所有 阅读全文
posted @ 2021-10-04 00:50 踏浪前行 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 因为自己总记不太清具体的意义,这里梳理一下: 这里的TP、FN、FP、TN,其实真正对应的都说的是预测 TP:真(预测结果是否正确)的正样本(预测),实际也是正样本 FN:假(预测结果是否正确)的负样本(预测),实际也是正样本 FP:假(预测结果是否正确)的正样本(预测),实际是负样本 TN:真(预 阅读全文
posted @ 2021-10-02 17:42 踏浪前行 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 1、明确业务目标? 2、询问当前的解决方案?为什么不满足要求? 加州住房价格为例: 1、回答框架问题:监督学习,回归,在线学习更好(批量学习就可以胜任)。 多重回归问题:利用多个特征进行预测。 一元回归问题:预测每个区域的单个值。 2、选择性能指标:(这里和范数表达差不多)(0范数:非零个数 无穷范 阅读全文
posted @ 2021-10-02 16:04 踏浪前行 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 在线学习:与批量学习不同,在线学习系统可以进行增量学习,快速适应不断变化的数据和自动系统,能够处理大量数据。 核外学习:数据量太大内存无法一次性容纳,分批进行学习,采用线上学习。 机器学习的挑战:数据集的缺乏,质量问题,数据代表性不足,数据量不足。 train-dev集:训练集和测试集分布有差异,所 阅读全文
posted @ 2021-10-02 13:27 踏浪前行 阅读(29) 评论(0) 推荐(0) 编辑