随笔 - 388
文章 - 1
评论 - 31
阅读 -
94万
05 2018 档案
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
摘要:https://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分
阅读全文
收集的各种正则判断
摘要:一个特牛的日期时间判断正则表达式这里是判断yyyy-mm-dd这种格式的,基本上把闰年和2月等的情况都考虑进去了。^((((1[6-9]|[2-9]/d)/d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]/d|3[01]))|(((1[6-9]|[2-9]/d)/d{2})
阅读全文
tensoflow学习入门一
摘要:对于如何创建图并开启session,参考如下
阅读全文
如何解决机器学习中数据不平衡问题
摘要:https://blog.csdn.net/lujiandong1/article/details/52658675 几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是
阅读全文
最优化方法:拉格朗日乘数法
摘要:https://blog.csdn.net/pipisorry/article/details/52135854 https://blog.csdn.net/yujianmin1990/article/details/48494607 解决约束优化问题——拉格朗日乘数法 拉格朗日乘数法(Lagran
阅读全文
几种常见的优化算法
摘要:https://www.cnblogs.com/xinbaby829/p/7289431.html 我们每个人都会在我们的生活或者工作中遇到各种各样的最优化问题,比如每个企业和个人都要考虑的一个问题“在一定成本下,如何使利润最大化”等。最优化方法是一种数学方法,它是研究在给定约束之下如何寻求某些因素
阅读全文
tensorflow安装相关问题
摘要:安装步骤 要求:Python必须是64位根据TensorFlow的计算方式,TensorFlow的安装分为CPU版本和GPU版本对于Python3.5或者Python3.6,可以使用pip install tensorflow(安装CPU版本)和pip install tensorflow-gpu(
阅读全文
基于spring+quartz的分布式定时任务框架
摘要:https://www.cnblogs.com/aaronfeng/p/5537177.html 问题背景 我公司是一个快速发展的创业公司,目前有200人,主要业务是旅游和酒店相关的,应用迭代更新周期比较快,因此,开发人员花费了更多的时间去更=跟上迭代的步伐,而缺乏了对整个系统的把控 没有集群之前,
阅读全文
DeepLearning (三) 预处理:主成分分析与白化
摘要:【原创】Liu_LongPo 转载请注明出处 【CSDN】http://blog.csdn.net/llp1992 PCA算法前面在前面的博客中已经有介绍,这里简单在描述一下,更详细的PCA算法请参考我的博客: 机器学习实战ByMatlab(二)PCA算法 PCA 的主要计算步骤 1.数据预处理,使
阅读全文
白化whitening
摘要:原文地址:http://blog.csdn.net/hjimce/article/details/50864602 作者:hjimce 一、相关理论 白化这个词,可能在深度学习领域比较常遇到,挺起来就是高大上的名词,然而其实白化是一个比PCA稍微高级一点的算法而已,所以如果熟悉PCA,那么其实会发现
阅读全文
如何使用RestTemplate访问restful服务
摘要:https://www.jianshu.com/p/c9644755dd5e 一. 什么是RestTemplate 传统情况下在java代码里访问restful服务,一般使用Apache的HttpClient。不过此种方法使用起来太过繁琐。spring提供了一种简单便捷的模板类来进行操作,这就是Re
阅读全文
机器学习笔记——最小二乘法
摘要:https://www.cnblogs.com/wangkundentisy/p/7505487.html 一. 简介 首先来看百度百科对最小二乘法的介绍:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这
阅读全文
文本处理方法概述
摘要:https://www.cnblogs.com/arachis/p/text_dig.html 说明:本篇以实践为主,理论部分会尽量给出参考链接 摘要: 1.分词 2.关键词提取 3.词的表示形式 4.主题模型(LDA/TWE) 5.几种常用的NLP工具简介 6.文本挖掘(文本分类,文本标签化) 6
阅读全文
机器学习——几种距离度量方法比较
摘要:https://my.oschina.net/hunglish/blog/787596 1. 欧氏距离(Euclidean Distance) 欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2)
阅读全文
交叉验证(Cross Validation)简介
摘要:一、训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(testing set)这两个子集,前者用以建立模型(model),后者则用来评
阅读全文
机器学习:什么是欠拟合和过拟合
摘要:https://blog.csdn.net/u011630575/article/details/71158656 1. 什么是欠拟合和过拟合 先看三张图片,这三张图片是线性回归模型 拟合的函数和训练集的关系 类似的,对于逻辑回归同样也存在欠拟合和过拟合问题,如下三张图 2. 如何解决欠拟合和过拟合
阅读全文
使用HTTPS与SSL来保证安全性
摘要:原文链接:https://developer.android.com/training/articles/security-ssl.html SSL,安全套接层(TSL),是一个常见的用来加密客户端和服务器通信的模块。 但是应用程序错误地使用SSL可能会导致应用程序的数据在网络中被恶意攻击者拦截。为
阅读全文
特征工程(6)-数据预处理数据变换
摘要:https://www.deeplearn.me/1397.html 上一篇讲解了使用哑编码的方式来进行数据预处理,这篇文章看起来只是用来作为数据类型的转换,比如多项式操作或者自定义函数 常见的数据变换有基于多项式的、基于指数函数的、基于对数函数的。2 个特征,度为 2 的多项式转换公式如下: (x
阅读全文
特征工程(1)-数据预处理标准化
摘要:https://www.deeplearn.me/1376.html 机器学习中特征工程的构造分析,以前在这方便还是没有去全面的了解,最近有一段磨刀的时间,还是从基础学习开始,理论结合代码推进 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题: 不属于同一量纲,无量纲化处理:即特征的
阅读全文
特征工程(2)-数据预处理区间缩放法
摘要:https://www.deeplearn.me/1383.html 区间缩放法原理 最常见的就是使用最大最下值来进行处理,处理的公式如下 y=x−minmax−miny=x−minmax−min 上述公式中 min 代表数据最小值,max 代表数据最大值 部分结果如下:[[ 0.22222222
阅读全文
特征工程(3)-数据预处理归一化
摘要:既然讲到归一化和前面的标准化需要对比一下,首先二者处理的维度是不一样的,假设我们要处理的矩阵是 m*n 大小,m 个样本,n 维特征 标准化处理的方式是以列为单位,也就是处理的对象是 m∗kk=1……..nm∗kk=1……..n 归一化处理的方式却是以行为单位,处理的对象如下: k∗nk=1……..
阅读全文
特征工程(4)-数据预处理二值化
摘要:https://www.deeplearn.me/1389.html 上一篇文章讲解了区间缩放法处理数据,接下来就讲解二值化处理 这个应该很简单了,从字面意思就是将数据分为 0 或者 1,联想到之前图像处理里面二值化处理变为黑白图片 下面还是进入主题吧 首先给出当前的二值化处理公式: y={0if
阅读全文
特征工程(5)-数据预处理哑编码
摘要:https://www.deeplearn.me/1393.html 哑编码概念 先来讲解下哑编码的概念吧,当你的变量不是定量特征的时候是无法拿去进行训练模型的,哑编码主要是针对定性的特征进行处理然后得到可以用来训练的特征 关于定性和定量还是在这里也说明下,举个例子就可以看懂了 定性: 博主很胖 博
阅读全文
大型系统重构的步骤简单梳理
摘要:https://blog.csdn.net/linsongbin1/article/details/51906661 概述 随着公司业务不断的发展,用户量不断的增加,对系统的性能要求会越来越高,而原来仓促做出来的项目,其不合理性的地方就会不断的暴露出来。大家如果接触过非常赚钱的互联网产品,一定会知道
阅读全文
阿里电商架构演变之路
摘要:https://yq.aliyun.com/articles/161190 摘要: 首届阿里巴巴中间件技术峰会上,阿里巴巴中间件技术部专家唐三带来“阿里电商架构演变之路”的演讲,本文从阿里业务和技术架构开始引入,分别分享了阿里电商从1.0到4.0架构的演变之路,着重分析了分布式和异地多活的改变之路。
阅读全文
前后端分离的思考与实践(六)
摘要:原文出处: 淘宝UED - 筱谷 Nginx + Node.js + Java 的软件栈部署实践 起 关于前后端分享的思考,我们已经有五篇文章阐述思路与设计。本文介绍淘宝网收藏夹将 Node.js 引入传统技术栈的具体实践。 淘宝网线上应用的传统软件栈结构为 Nginx + Velocity + J
阅读全文
前后端分离的思考与实践(五)
摘要:原文出处: 淘宝UED - 筱谷 基于前后端分离的多终端适配 前言 近年来各站点基于 Web 的多终端适配进行得如火如荼,行业间也发展出依赖各种技术的解决方案。有如基于浏览器原生 CSS3 Media Query 的响应式设计、基于云端智能重排的「云适配」方案等。本文则主要探讨在前后端分离基础下的多
阅读全文
前后端分离的思考与实践(四)
摘要:原文出处: 淘宝UED - lorrylockie 前后端分离模式下的安全解决方案 前言 在前后端分离的开发模式中,从开发的角色和职能上来讲,一个最明显的变化就是:以往传统中,只负责浏览器环境中开发的前端同学,需要涉猎到服务端层面,编写服务端代码。而摆在面前的一个基础性问题就是如何保障Web安全?
阅读全文
前后端分离的思考与实践(三)
摘要:原文出处: 淘宝UED - 善繁 Midway-ModelProxy — 轻量级的接口配置建模框架 前言 使用Node做前后端分离的开发模式带来了一些性能及开发流程上的优势(见《前后端分离的思考与实践 一》), 但同时也面临不少挑战。在淘宝复杂的业务及技术架构下,后端必须依赖Java搭建基础架构,同
阅读全文
前后端分离的思考与实践(二)
摘要:原文出处: 淘宝UED - Herman 基于前后端分离的模版探索 前言 在做前后端分离时,第一个关注到的问题就是 渲染,也就是 View 这个层面的工作。 在传统的开发模式中,浏览器端与服务器端是由不同的前后端两个团队开发,但是模版却又在这两者中间的模糊地带。因此模版上面总不可避免的越来越多复杂逻
阅读全文
前后端分离的思考与实践(一)
摘要:原文出处: 淘宝UED - 常胤 也谈基于NodeJS的全栈式开发(基于NodeJS的前后端分离) 前言 为了解决传统Web开发模式带来的各种问题,我们进行了许多尝试,但由于前/后端的物理鸿沟,尝试的方案都大同小异。痛定思痛,今天我们重新思考了“前后端”的定义,引入前端同学都熟悉的NodeJS,试图
阅读全文
文本主题模型之LDA(一) LDA基础
摘要:https://www.cnblogs.com/pinard/p/6831308.html http://www.360doc.com/content/16/0428/10/478627_554452907.shtml LDA(Latent Dirichlet Allocation)是一种文档主题生
阅读全文