随笔分类 - 杂类
摘要: 数据导出限制 Export data from a Power BI visualization - Power BI | Microsoft Docs 编辑 DataSet刷新频率限制 Data Refresh in Power BI - Ownership and the Refresh
阅读全文
摘要: 对于一个劳动力密集型产业来说,做预算判断未来的财月的运营成本,往往可以简化成下面这个公式: 成本= 员工数目 * 人均开销 其中人均开销包括薪资,培训费用和办公费用,这个些费用往往比较固定或者易于计算,可以视为定量. 于是,剩下的变量就是员工数目又叫HeadCount. 预测成本的关键就在于预测
阅读全文
摘要:快销行业有线下的门店,随着电商的兴起,大多也有线上的网店。 很多快销的品牌也搭建了自己的会员系统,在微信或者支付宝里都能领会员卡。 在这样的大背景下,就诞生了很多大数据的分析需求来提高市场营销的成果和精准度,即标题所说的CRM大数据。 基于数据分析的顾客分类 通过购买频率和购买渠道,对顾客进行一个笼
阅读全文
摘要:发现我Xubuntu(Ubuntu 20.04.1 Linux)的环境下, putty的复制粘贴的快捷键和普通终端不一样。 粘贴: ctrl + shift + insert 复制: 选中内容,ctrl + 鼠标右键。 Status_Access_Denied: This error may mea
阅读全文
摘要:mxnet 出现错误 RuntimeError: CUDA out of memory. Tried to allocate windows下可以这样做:打开cmd窗口,输入nvidai-smi查看显卡使用情况如图 windows杀进程: taskkill /F /PID 1234 var code
阅读全文
摘要:pip install apache-airflow 注意点: 0. airflow 对python lib的版本要求很奇怪,会要求一些老版本的lib,导致和其他软件冲突,建议使用 “python -m venv airflow-venv”为它创建单独的环境。 1. airflow 默认用sqlit
阅读全文
摘要:输入命令,生成秘钥sshkey,引号中为注释,这里为自己注册gitlab的邮箱。 使用TortoiseGit,如果每次clone/push/pull都出现totoisegitplink的密码输入框,就需改下面这个配置 从totoisegitplink.exe 改成 ssh.exe 修改Tortois
阅读全文
摘要:linux普通用户获取root级别权限,有两种方法: 一个提权,即编辑 /etc/passwd,把自己的uid改成0,uid可以直接用命令id查看还一个sudo,即编辑 /etc/sudoer(等效于命令 visudo),把自己加入到可以sudo的用户列表,还可以配置免密sudo 另外在有配置ker
阅读全文
摘要:https://blog.csdn.net/asd051377305/article/details/81879872 问题背景 公司项目中应用到的jdk环境为1.6,最近在家学习IntelliJ IDEA中sdk多环境配置时,想安装Jdk1.8,作为学习基础。那么问题来了,公司项目扩展不支持jdk
阅读全文
摘要:假设azkaban安装在:/usr/local/azkaban/ 配置用户:编辑/usr/local/azkaban/azkaban-web-server/conf/azkaban-user.xml 权限列表: ADMIN Grants all access to everything in Azk
阅读全文
摘要:azcopy 有过一次大的命令行接口更新: 7.x的版本 命令形如: azcopy --source .... --destination ... 10.x的版本 命令形如:azcopy copy 10.x的版本在“azcopy”后面有子命令,比如copy 现在一般都用10.x的版本了。 安装说明:
阅读全文
摘要:Project git url: https://github.com/ss/openwrt-ss 包含 ss-{local,redir,tunnel} 三个可执行文件 默认启动 ss-local 建立本地 SOCKS 代理 ss-libev-spec 为针对 OpenWrt 路由器的优化版本包含
阅读全文
摘要:Redis有两个linux和windows两个版本,截至本文发表时,linux是5.05,而windows的版本不是官方的,版本为3.2。 这两个版本的redis的dump.rdb文件并不兼容。 Linux的redis安装:下载官网的压缩包,tar xzvf 解压,cd进入src目录,make in
阅读全文
摘要:转自: http://www.ha97.com/5095.html PS:下面是性能测试的主要概念和计算公式,记录下: 一.系统吞度量要素: 一个系统的吞度量(承压能力)与request对CPU的消耗、外部接口、IO等等紧密关联。 单个reqeust 对CPU消耗越高,外部系统接口、IO影响速度越慢
阅读全文
摘要:安全库存公式: 在计算安全库存公式时,其实我们面对的是两个正态分布: 1. 供应周期的正态分布 2. 需求的正态分布 安全库存就是在这两个正态分布的上下浮动过程中能覆盖一定供应水平的一个标准差。 举例来说,标准正态分布的x取值范围在(-1.96,1.96)之间的时候,能覆盖95%的情况,所以当安全库
阅读全文
摘要:Cloudera Manager 简称 CM, 是企业级的大数据集群安装/升级/管理平台, 帮助用户通过网页上的简单操作控制整个集群. 其功能如下: 1. 提供一个software repository, 方便在各个节点上安装大数据的组件 2. 批量配置 3. 集群监控 4. 集群升级/回滚/备份
阅读全文
摘要:企业级大数据集群有两个层面的安全系统: 一个是每一台服务器的本地有个linux的账户系统,这个可以批量处理配置。为每个服务器建立一个本地的账号和组。用这个账号去SSH登录。 另一个就是大数据集群,即Hadoop的账号系统,是Hadoop通过 Kerberos 协议实现的。Kerberos是一个协议,
阅读全文
摘要:Oracle 表名区分大小写。 select table_name from user_tables where table_name like '%xxxxx%'; select OWNER, TABLE_NAME, COLUMN_NAME from all_tab_columns where C
阅读全文
摘要:在Spoon的文件栏, Edit->Edit Kettle Properties files 将 KETTLE_DEFAULT_BIGNUMBER_FORMAT 项配置为0.##### 否则的话, 默认Kettle对它认为是BigNumber的列 ,把0 会强行写成0.0, 造成不必要的冗余
阅读全文
摘要:起因: Hive查询变慢 观察: Cloudera Manager中某个Datanode报错, Health Chart每隔几分钟有红色不健康状态 观察日志: 在 /data/log/hadoop-hdfs/hadoop-cmf-hdfs-DATANODE-dw-slave01-te.uniqlo-
阅读全文