摘要: 1、互联网用户数量 中国互联网络信息中心(CNNIC)2018.8.20日发布第42次《中国互联网络发展状况统计报告》显示:截止2018年6月30日,我国网民规模达8.02亿,普及率为57.7%。其中,手机网民规模达7.88亿,网民通过手机接入互联网的比例高达98.3%。我国是互联网用户最多的国家。 阅读全文
posted @ 2018-12-14 15:45 AIData 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 机器学习首先面临的一个问题就是准备数据,数据的来源大概有这么几种:公司积累数据,购买,交换,政府机构及企业公开的数据,通过爬虫从网上抓取。本篇介绍怎么写一个爬虫从网上抓取公开的数据。 很多语言都可以写爬虫,但是不同语言的难易程度不同,Python作为一种解释型的胶水语言,上手简单、入门容易,标准库齐 阅读全文
posted @ 2018-12-08 11:04 AIData 阅读(59793) 评论(2) 推荐(0) 编辑
摘要: 此篇 TensorFlow简要教程及线性回归算法示例 介绍了使用TensorFlow进行机器学习的基本流程,此篇 介绍一个快速确定神经网络模型中各层矩阵维度的方法 介绍了在设计神经网络的时候怎么确定各层矩阵的维度(矩阵的行数与列数),接下来就可以开始训练模型了,在训练模型的过程中,怎么衡量模型的好坏 阅读全文
posted @ 2018-12-06 16:29 AIData 阅读(2490) 评论(0) 推荐(1) 编辑
摘要: 深度学习在设计神经网络结构时需要指定每个隐藏层权重矩阵、偏置项的维度,有的时候容易搞混淆,导致运行时产生维度不对的错误,特别是对于隐藏层既深又宽的网络,更容易出错。下面以一个实例来说明怎么简单快速确定每一层各个矩阵的维度。 假设需要拟合的函数为:y=f(x)=WX+b。 损失函数:J(W,b) 其中 阅读全文
posted @ 2018-12-05 13:03 AIData 阅读(7976) 评论(0) 推荐(0) 编辑
摘要: TensorFlow是谷歌推出的深度学习平台,目前在各大深度学习平台中使用的最广泛。 一、安装命令 pip3 install -U tensorflow --default-timeout=1800 -i https://mirrors.ustc.edu.cn/pypi/web/simple 上面是 阅读全文
posted @ 2018-12-04 12:52 AIData 阅读(2069) 评论(0) 推荐(0) 编辑
摘要: 计算机程序主要就是输入数据 经过处理之后 输出结果,安全问题由此产生,凡是有输入的地方都可能带来安全风险。根据输入的数据类型,Web应用主要有数值型、字符型、文件型。 要消除风险就要对输入的数据进行检查,对于Web应用来说,检查的位置主要是前端和后端。前端检查只能防止正常状况,没法防止通过工具、程序 阅读全文
posted @ 2018-12-03 11:57 AIData 阅读(9014) 评论(0) 推荐(3) 编辑
摘要: 时间序列数据库简称时序数据库(Time Series Database),用于处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。 时序数据的几个特点 1. 基本上都是插入,没有更新的需求。 2. 数据基本上都有时间属性,随着时间的推移不断产生新的数据。 3 阅读全文
posted @ 2018-12-02 10:20 AIData 阅读(8886) 评论(0) 推荐(0) 编辑
摘要: 在互联网产品上线之后,产品和运营人员需要即时了解产品的使用情况,有多少用户,用户使用了哪些功能,停留时长,使用路径。。。等。要回答这些问题,需要有数据,不能拍脑袋想当然。数据怎么得到呢?埋点就是采集数据的重要途径。 数据埋点不是新名词,在电脑网站出来之后就有统计工具,站长们很熟悉的谷歌、百度统计等工 阅读全文
posted @ 2018-12-01 19:16 AIData 阅读(1280) 评论(2) 推荐(0) 编辑
摘要: 问题来源 互联网项目通常都是大用户量,大并发,因此从技术架构上大多采用分布式架构构建成大型分布式系统,SOA或者是微服务,一个请求涉及到多个子系统,如果某个请求的处理不正常,怎么排查定位问题呢?如果没有合适的手段,排查问题无异大海捞针,为了提高解决问题的效率,迫切需要有一个技术手段能跟踪整个处理环节 阅读全文
posted @ 2018-11-30 22:44 AIData 阅读(932) 评论(2) 推荐(0) 编辑