摘要: 统一社会信用代码规则: 身份证号码规则: 阅读全文
posted @ 2020-06-20 21:10 _XiongH 阅读(4660) 评论(0) 推荐(1) 编辑
摘要: 今天就为大家分享一篇Python多进程写入同一文件的方法,具有很好的参考价值,希望对大家有所帮助。 最近用python的正则表达式处理了一些文本数据,需要把结果写到文件里面,但是由于文件比较大,所以运行起来花费的时间很长。但是打开任务管理器发现CPU只占用了25%,上网找了一下原因发现是由于一个叫G 阅读全文
posted @ 2020-06-20 08:29 _XiongH 阅读(7676) 评论(0) 推荐(0) 编辑
摘要: 一、subprocess以及常用的封装函数运行python的时候,我们都是在创建并运行一个进程。像Linux进程那样,一个进程可以fork一个子进程,并让这个子进程exec另外一个程序。在Python中,我们通过标准库中的subprocess包来fork一个子进程,并运行一个外部的程序。subpro 阅读全文
posted @ 2020-06-16 14:39 _XiongH 阅读(770) 评论(0) 推荐(0) 编辑
摘要: subprocess是Python 2.4中新增的一个模块,它允许你生成新的进程,连接到它们的 input/output/error 管道,并获取它们的返回(状态)码。这个模块的目的在于替换几个旧的模块和方法,如: os.system os.spawn* 1. subprocess模块中的常用函数 阅读全文
posted @ 2020-06-16 14:36 _XiongH 阅读(903) 评论(0) 推荐(0) 编辑
摘要: 先从大数据数据仓库建设的整体架构说起。 下图是数据仓库的逻辑分层架构: 想看懂数据仓库的逻辑分层架构,必须先弄懂以下4大概念。 数据源:数据来源,互联网公司的数据来源随着公司的规模扩张而呈递增趋势,同时自不同的业务源,比如埋点采集,客户上报,API等。 ODS层:数据仓库源头系统的数据表通常会原封不 阅读全文
posted @ 2020-06-12 11:27 _XiongH 阅读(967) 评论(0) 推荐(1) 编辑
摘要: public class SimilarityUtils { public static void main(String[] args) { //要比较的两个字符串 String str1 = "鞋子不能在实体店买"; String str2 = "不能在实体店买鞋子"; levenshtein( 阅读全文
posted @ 2019-11-05 09:31 _XiongH 阅读(1353) 评论(0) 推荐(0) 编辑
摘要: Pandas在绘图时,会显示中文为方块,主要原因是 matplotlib 字体问题和 seaborn 字体问题。实际上,matplotlib是支持unicode编码的,中文乱码得主要问题是没有找到合适的中文字体。 如下图: 解决办法:我们只要手动添加中文字体的名称就可以了。 python代码如下: 阅读全文
posted @ 2019-10-23 10:39 _XiongH 阅读(600) 评论(0) 推荐(0) 编辑
摘要: ContainerContainer就是一个yarn的java进程,在Mapreduce中的AM,MapTask,ReduceTask都作为Container在Yarn的框架上执行,你可以在RM的网页上[8088端口]看到Container的状态。 基础Yarn的ResourceManger(简称R 阅读全文
posted @ 2019-08-31 07:17 _XiongH 阅读(997) 评论(0) 推荐(1) 编辑
摘要: Container是什么? Container就是一个yarn的java进程,在Mapreduce中的AM,MapTask,ReduceTask都作为Container在Yarn的框架上执行,可以在RM的网页上看到Container的状态。 基础 Yarn的ResourceManger(简称RM)通 阅读全文
posted @ 2019-08-30 18:02 _XiongH 阅读(420) 评论(0) 推荐(0) 编辑
摘要: Hadoop YARN同时支持内存和CPU两种资源的调度,本文将介绍YARN是如何对这些资源进行调度和隔离的。 在YARN中,资源管理由ResourceManager和NodeManager共同完成,其中,ResourceManager中的调度器负责资源的分配,而NodeManager则负责资源的供 阅读全文
posted @ 2019-08-30 15:49 _XiongH 阅读(282) 评论(0) 推荐(0) 编辑