2018年5月28日

摘要: 代码可读性是评判代码质量的标准之一,有一个衡量代码质量的标准是 Martin 提出的 “WFT” 定律,即每分钟爆出 “WTF” 的次数。你在读别人代码或者做 Code Review 的时候有没有 “WTF” 冲动呢? 为了帮助开发者统一代码风格,Python 社区提出了 PEP8 代码编码风格,它 阅读全文
posted @ 2018-05-28 11:23 cuiyubo 阅读(251) 评论(0) 推荐(0) 编辑

2018年5月21日

摘要: 传统 CRF 中的输入 X 向量一般是 word 的 one-hot 形式,前面提到这种形式的输入损失了很多词语的语义信息。有了词嵌入方法之后,词向量形式的词表征一般效果比 one-hot 表示的特征要好。本文先主要介绍了LSTM、词嵌入与条件随机场,然后再从序列标注问题探讨 BiLSTM与CRF等 阅读全文
posted @ 2018-05-21 11:07 cuiyubo 阅读(536) 评论(0) 推荐(0) 编辑

2018年5月14日

摘要: 为什么数据前面加个大? 不加大你不点,不加大不时髦,不加大不够大! 先从一个故事讲起,某养猪场厂长告诉A分析尸,我要看几个数据,你提取一下,一周后给我看看。 A分析尸列出: 猪总数10000、收入500万、净利润180万。 猪场老板一看,说:做的不错,A君好好干。 同样的问题,猪场老板给了B分析尸, 阅读全文
posted @ 2018-05-14 10:03 cuiyubo 阅读(591) 评论(0) 推荐(0) 编辑

2018年5月7日

摘要: 使用Detectron预训练权重输出 *e2e_mask_rcnn-R-101-FPN_2x* 的示例 从Detectron输出的相关示例 使用Detectron预训练权重输出 *e2e_keypoint_rcnn-R-50-FPN_s1x*的示例 这个代码是按照Detectron的安装架构来实现的 阅读全文
posted @ 2018-05-07 00:07 cuiyubo 阅读(770) 评论(0) 推荐(0) 编辑

2018年5月2日

摘要: 本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。 通过本文系列文章您将能够学到的知识如下: 应用Python进行大数据与机器学习 应用Spark进行大数据分析 实现机器学习算法 学习使用NumPy库处理数值数据 学习使用Pandas库 阅读全文
posted @ 2018-05-02 11:50 cuiyubo 阅读(734) 评论(0) 推荐(0) 编辑

2018年4月23日

摘要: Pandas Pandas是 Python下最强大的数据分析和探索工具。它包含高级的数据结构和精巧的工具,使得在 Python中处理数据非常快速和简单。 Pandas构建在 Numpy之上,它使得以 Numpy为中心的应用很容易使用。Pandas的功能非常强大,支持类似于SQL的数据增、删、查、改, 阅读全文
posted @ 2018-04-23 11:22 cuiyubo 阅读(2102) 评论(0) 推荐(1) 编辑

2018年4月16日

摘要: 目前市面上,专门做IT审计堡垒机的厂商有很多,他们的产品都有一个特点,那就是基本上每台的售价都在20万以上。像我们做技术的,不可能每次待的公司都是大公司,那么在小公司,是不太可能投资20多万买一台硬件的堡垒机来使用,但是我们如果要规范我们的技术人员的行为规范,那么对技术人员的操作进行审计又是必不可少 阅读全文
posted @ 2018-04-16 10:05 cuiyubo 阅读(222) 评论(0) 推荐(0) 编辑

2018年4月9日

摘要: 如果你善于使用Pandas变换数据、创建特征以及清洗数据等,那么你就能够轻松地使用Dask和Numba并行加速你的工作。单纯从速度上比较,Dask完胜Python,而Numba打败Dask,那么Numba+Dask基本上算是无敌的存在。将数值计算分成Numba sub-function和使用Dask 阅读全文
posted @ 2018-04-09 09:06 cuiyubo 阅读(612) 评论(0) 推荐(0) 编辑

2018年3月12日

摘要: Pipenv是Kenneth Reitz在一年多前创建的“面向程序员的Python开发工作流程”,现在已成为管理软件包依赖关系的Python官方推荐资源。 Python软件包安装管理的简要历史 为了正确理解Pipenv解决的问题,有必要了解Python软件包管理的发展历史。 起初,我们有Python 阅读全文
posted @ 2018-03-12 09:54 cuiyubo 阅读(204) 评论(0) 推荐(0) 编辑

2018年2月5日

摘要: 目的:Shelve模块为任意能够pickle的Python对象实现持久化存储,并提供一个类似字典的接口。 在关系型数据库还过于复杂的情境中,Shelve为你提供了Python对象持久化的另一种方案。 创建一个新的Shelf 使用shelf最简单的方法是使用DbfilenameShelf类,它使用db 阅读全文
posted @ 2018-02-05 10:47 cuiyubo 阅读(213) 评论(0) 推荐(0) 编辑

导航