摘要:
一、说在前面 今天以《淘宝网》为例描绘质量属性的六个常见属性场景。分别是:可用性、可修改性、性能、安全性、可测试性和易用性。 二、具体内容 (1)可用性:可用性强,淘宝网的用户众多,需要其涵盖众多数据,并且通俗易懂能满足大多数用户的使用。 (2)可修改性:不同的商家的界面都可以由商家自己来设计,具有 阅读全文
摘要:
一、说在前面 今天读了王概凯的九篇架构漫谈,收获颇丰,在这里做下笔记,并围绕软件架构师如何工作进行谈一谈。 二、笔记 一、什么是架构 产生架构的原因: 个人观点:当大家需要合作完成一件事情的时候,每个人都有自己擅长做的事情,于是当分工发生后每个人的实际生产力都因为做了自己擅长的事情得到了提高,就可以 阅读全文
摘要:
一、笔记 数据的初步诊断与探索 数据类型、数据对象 数据集由样本构成、一个数据对象表示一个实体 特征表征样本某个特征的数据域 统计信息 相似性度量 缺失值处理和离群值检测 删除法、填补法 基于统计、基于近邻的方法 常用的数据转换方法 特征编码 标准化、离散化 二、借鉴 学习中看到一位博主写的很详细, 阅读全文
摘要:
一、说在前面 老师给找的课好久了一直没看,今天开始! 二、笔记 一、数据的特性 广泛性 多样性 结构化数据 关系数据 非结构化数据80%以上 网页 文本 图像 视频 语音 二、数据科学的内涵 1.用数据的方法研究科学 生物信息学、天体信息学、地球科学等 例: 开普勒三大定律 2.用科学的方法研究数据 阅读全文
摘要:
一、说在前面 最近学习区块链,区块的hash值作为一个区块的指纹,那么如何让一个hash值与一个区块的信息唯一对应呢,就用到了sha256算法。 二、sha256 对于不同的输入,哪怕是有一点点微小的差别,输出结果都会产生较大的差异 对于相同的输入,会产生相同的输出 输出结果是一串复杂的定长字符串, 阅读全文
摘要:
一、说在前面 今天是这系列课程的最后一门课,虽然10节课听下来对机器学习内部的核心算法还有具体流程等等都还不太了解,但也算是对机器学习有了一个初步浅显的认识,对机器学习的探索不会止步于此。 二、笔记 1、强化学习概述 机器学习方法 有监督学习 数据集中的样本带有标签,有明确目标 回归和分类 无监督学 阅读全文
摘要:
一、说在前面 今天主要了解了一下深度学习的背景和相关浅层的知识。深度学习的应用领域和相关的问题,老师为我们进行了介绍,算是一个开始深度学习的概括总览了。 二、笔记 深度学习 1、深度学习的发展 图像识别 语音识别 玩游戏深度学习获得发展的原因 2、深度学习的核心思想 感知机 多层感知机 多个神经元以 阅读全文
摘要:
一、说在前面 今天的学习内容是机器学习中的维度灾难,它就像编程中的空指针异常一样非常的让人头疼但又经常如影随形。学习的过程中让我感受颇深的一句话是,如无必要,勿增实体。如果简单的东西可以达到复杂东西的效果,那还用复杂的干嘛呢,也提醒我们在编码的时候要尽可能的精简,不要那么多无用的冗余。 二、笔记 维 阅读全文
摘要:
一、说在前面 今天学习的是机器学习当中的最优化的问题,如何将自己的模型更加优化。 二、笔记 1、机器学习模型的优化目标 最小化损失函数 2、随机梯度下降(SGD) 沿着斜坡向下走 在实际引用中,有两种处理方法 线性衰减,然后保持为常数 开始为常数,当训练误差不再变化或变化非常小时,缩小为原来的1/1 阅读全文
摘要:
一、说在前面 今天学习的是降维,把数据的特征数量从高维转换到低维,降低数据的处理难度,其中自编码器和解码器的效果比较像压缩和解压缩。 二、笔记 1、什么是降维? 数学知识:特征值分解 设A是n阶方阵,如果有常数λ和n维非零列向量α的关系式 Aα = λα 成立,则称λ为方阵A的特征值,非零向量α称为 阅读全文