yangyang12138

导航

2020年2月17日 #

pandas(三)

摘要: DataFrame 1.概述 dataframe是pandas的核心功能,核心values通过numpy的ndarray来维护,在此基础上实现了columns和index功能。 2.Attributes and underlying data index索引,即行的名称,columns列名称,axe 阅读全文

posted @ 2020-02-17 12:57 杨杨09265 阅读(166) 评论(0) 推荐(0) 编辑

2020年2月15日 #

pandas(二)

摘要: 1.Series序列 一维的数组数据,构建是传二维数据会报错,数据具有索引,构建时如果不传索引,默认为数字rang索引。 series存在列名和索引,sr.at[0]是通过列名来定位数据(iat定位行和列),sr.loc通过索引来定位数据(iat定位行和列)。 Conversion series可以 阅读全文

posted @ 2020-02-15 15:15 杨杨09265 阅读(120) 评论(0) 推荐(0) 编辑

2020年2月14日 #

word2vec

摘要: 一.概述 word2vec用于处理文本字符串,类似的功能如sklearn的CountVectorizer,TfidfVectorizer,HashingVectorizer CountVectorizer用每个词出现的次数做为向量的值,如特征空间内宫n个词,特征向量i中如果第j个word出现了n次则 阅读全文

posted @ 2020-02-14 04:03 杨杨09265 阅读(142) 评论(0) 推荐(0) 编辑

2020年2月1日 #

pandas(一)

摘要: pandas.io 1.概述,主要从txt,json,pkl,csv,excel中读取数据,读取的数据最终转化为pandas.core.frame.DataFrame类型的df 先来看总的api from pandas.io.clipboards import read_clipboard #读剪切 阅读全文

posted @ 2020-02-01 01:36 杨杨09265 阅读(206) 评论(0) 推荐(0) 编辑

2019年12月26日 #

tensorflow(七)

摘要: 一、模型托管工具 TensorFlow Serving TensorFlow Serving支持生产级的服务部署,允许用户快速搭建从模型训练到服务发布的工作流水线。 工作流水线主要由三部分构成 (1).持续训练过程:基于持续输入的批数据,使用TensorFlow不断训练模型,并将模型定期保存到指定目 阅读全文

posted @ 2019-12-26 02:02 杨杨09265 阅读(252) 评论(0) 推荐(0) 编辑

2019年12月25日 #

tensorflow(六)

摘要: 一、TensorBoard可视化工具 TensorBoard实现形式为web应用程序,这为提供分布式、跨系统的图形界面服务带来了便利。 1.使用流程 SummaryOps->Session--(input)-->FileWriter (add) >Event file (load)-->Tensor 阅读全文

posted @ 2019-12-25 01:21 杨杨09265 阅读(462) 评论(0) 推荐(0) 编辑

2019年12月24日 #

tensorflow(五)

摘要: 一、单机编程框架 单机程序是指启动和运行都在一台机器的一个进程中完成,因为没有网络开销,非常适合参数不多、计算量小的模型。 步骤,创建单机数据流图,创建并运行单机会话。 如果想指定机器上的设备如cpu,gpu 可以使用 with tf.device('/cpu:0'): …… 二、分布式程序编程框架 阅读全文

posted @ 2019-12-24 02:57 杨杨09265 阅读(427) 评论(0) 推荐(0) 编辑

2019年12月23日 #

tensorflow(四)

摘要: tensorflow数据处理方法, 1.输入数据集 小数据集,可一次性加载到内存处理。 大数据集,一般由大量数据文件组成,因为数据集的规模太大,无法一次性加载到内存,只能每一步训练时加载数据,可以采用流水线并行读取数据。 流水线并行读取数据过程, (1)创建文件名列表(2)创建文件名队列(3)创建R 阅读全文

posted @ 2019-12-23 03:45 杨杨09265 阅读(423) 评论(0) 推荐(0) 编辑

2019年12月22日 #

tensorflow(三)

摘要: 1.placeholder 一个数据占位符,用于在构建一个算法时留出一个位置,然后在run时填入数据。 2.variable 存储节点作为数据流图中的有状态节点,其主要作用是在多次执行相同数据流图时存储特定的参数,如深度学习或机器学习的模型参数。对于无状态节点,其输出由输入张量和节点操作共同确定,对 阅读全文

posted @ 2019-12-22 03:47 杨杨09265 阅读(472) 评论(0) 推荐(0) 编辑

2019年12月20日 #

tensorflow(二)

摘要: 使用图来表示计算任务 在被称之为session的上下文中执行图 使用tensor表示数据 通过变量来维护状态 使用feed和fetch可以为任意的操作复制或者从其中获取数据 tensorflow是一个编程系统,使用图来表示计算任务,图中的节点称之为op,一个op获得0个或多个tensor,执行计算, 阅读全文

posted @ 2019-12-20 02:01 杨杨09265 阅读(594) 评论(0) 推荐(0) 编辑