摘要:
代码可读性是评判代码质量的标准之一,有一个衡量代码质量的标准是 Martin 提出的 “WFT” 定律,即每分钟爆出 “WTF” 的次数。你在读别人代码或者做 Code Review 的时候有没有 “WTF” 冲动呢? 为了帮助开发者统一代码风格,Python 社区提出了 PEP8 代码编码风格,它 阅读全文
摘要:
传统 CRF 中的输入 X 向量一般是 word 的 one-hot 形式,前面提到这种形式的输入损失了很多词语的语义信息。有了词嵌入方法之后,词向量形式的词表征一般效果比 one-hot 表示的特征要好。本文先主要介绍了LSTM、词嵌入与条件随机场,然后再从序列标注问题探讨 BiLSTM与CRF等 阅读全文
摘要:
为什么数据前面加个大? 不加大你不点,不加大不时髦,不加大不够大! 先从一个故事讲起,某养猪场厂长告诉A分析尸,我要看几个数据,你提取一下,一周后给我看看。 A分析尸列出: 猪总数10000、收入500万、净利润180万。 猪场老板一看,说:做的不错,A君好好干。 同样的问题,猪场老板给了B分析尸, 阅读全文
摘要:
使用Detectron预训练权重输出 *e2e_mask_rcnn-R-101-FPN_2x* 的示例 从Detectron输出的相关示例 使用Detectron预训练权重输出 *e2e_keypoint_rcnn-R-50-FPN_s1x*的示例 这个代码是按照Detectron的安装架构来实现的 阅读全文
摘要:
本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。 通过本文系列文章您将能够学到的知识如下: 应用Python进行大数据与机器学习 应用Spark进行大数据分析 实现机器学习算法 学习使用NumPy库处理数值数据 学习使用Pandas库 阅读全文
摘要:
Pandas Pandas是 Python下最强大的数据分析和探索工具。它包含高级的数据结构和精巧的工具,使得在 Python中处理数据非常快速和简单。 Pandas构建在 Numpy之上,它使得以 Numpy为中心的应用很容易使用。Pandas的功能非常强大,支持类似于SQL的数据增、删、查、改, 阅读全文
摘要:
目前市面上,专门做IT审计堡垒机的厂商有很多,他们的产品都有一个特点,那就是基本上每台的售价都在20万以上。像我们做技术的,不可能每次待的公司都是大公司,那么在小公司,是不太可能投资20多万买一台硬件的堡垒机来使用,但是我们如果要规范我们的技术人员的行为规范,那么对技术人员的操作进行审计又是必不可少 阅读全文
摘要:
如果你善于使用Pandas变换数据、创建特征以及清洗数据等,那么你就能够轻松地使用Dask和Numba并行加速你的工作。单纯从速度上比较,Dask完胜Python,而Numba打败Dask,那么Numba+Dask基本上算是无敌的存在。将数值计算分成Numba sub-function和使用Dask 阅读全文
摘要:
Pipenv是Kenneth Reitz在一年多前创建的“面向程序员的Python开发工作流程”,现在已成为管理软件包依赖关系的Python官方推荐资源。 Python软件包安装管理的简要历史 为了正确理解Pipenv解决的问题,有必要了解Python软件包管理的发展历史。 起初,我们有Python 阅读全文
摘要:
目的:Shelve模块为任意能够pickle的Python对象实现持久化存储,并提供一个类似字典的接口。 在关系型数据库还过于复杂的情境中,Shelve为你提供了Python对象持久化的另一种方案。 创建一个新的Shelf 使用shelf最简单的方法是使用DbfilenameShelf类,它使用db 阅读全文