07 2019 档案
摘要:datax 是阿里巴巴官方开源的一个数据同步工具,可以用于诸多数据源之间的同步,并且使用简单、效率高。 datax 官方有提供 "编译好的版本" ,可以直接下载,但是其中包含有 BUG。 我最近遇到的一个问题是,当从 MongoDB 同步数据到传统的结构化数据库时(如MySQL),会出现字段无法对齐
阅读全文
摘要:原文出处:http://www.worldhello.net/2010/12/08/2178.html 本文略有改动 1.1 安装setuptools 首先要安装 工具。 下可以直接使用apt安装: 或者通过 安装: 更新 : 或者下载 的`whl`包来安装。可以在 "这里" 查看最新版本下载。下载
阅读全文
摘要:首先要在“程序和功能”里面开启这个服务 然后重启系统使其生效。 然后打开 PowerShell,输入: 上述语句会从服务器中获取 Ubuntu1804 LTS 版本,下载到本地(当前目录),下载后的本地文件名为 。 文件共有200+M,下载完后改名、解压: 以上均为 PowerShell 命令,后面
阅读全文
摘要:Series 从 numpy 数组创建,并指定索引值 如果没有指定索引,则默认会创建从 0 到 N 1 的数组作为索引值,这里的 N 是 Series 的长度(即它所包含的元素个数): 通过索引访问元素 从字典中创建 字典中的键将会作为索引值,字典中的值将会作为元素值: 从字典中创建 Series
阅读全文
摘要:写数据 NumPy 数组可以使用 方法保存到本地磁盘中,默认扩展名是 ,并且是未压缩的二进制格式。 如果没有指定文件扩展名,则默认将会是 如果要使用未压缩的 格式同时保存多个数组到一个文件中,则可以使用 方法: 相应的,如果从 文件中加载数据,将会得到一个类字典对象: 另一种保存数据到文件中的方法是
阅读全文
摘要:安装 superset 创建虚拟环境: 激活虚拟环境: 安装 如果遇到报错: 需要安装 : 装完 后,再执行 应该就没问题了。 配置 superset 创建管理员用户 执行的时候会有这么一行提示: 这是一个新的用法了,还没有研究 接着会让你输入用户名(username)、Fist Name、Last
阅读全文
摘要:有的时候,需要把整个 HTML 节点原封不动地取下来,也就是包括节点标签、节点内容,甚至也包括内容中的空格、各种特殊符号等等。 假设已获取到页面源码,并将其保存在变量 中。则可有代码如下:
阅读全文