摘要:
Airbnb的开源BI项目Superset: https://airbnb.io/projects/superset/ 自己在个人服务器上搭了一个Superset服务, 目的只是给别人看demo。 但是Superset需要登陆验证,没有账户无法查看。 所以研究了一下如何disable这个登录过程。 阅读全文
摘要:
结论: 在pandas中,非unique的index无法通过df.loc[index]来达到多行选择的目的。 以下面的数据为例: 4 假如我们之前对dataframe做了dataframe.set_index('month', inplace=True)操作,将month转换为index。 则无法通 阅读全文
摘要:
众所周知,数据科学(Data Science)是一门交叉十分严重的的学科,混杂了数理统计、数据挖掘、模式识别、人工智能、编程等众多领域,各个领域都有非常多的概念与定义重合。 这样复杂的学科背景让人无所适从,导致虽然很多人认为自己是做数据的,但不同的人具体的工作内容可能千差万别。 国外一个做数据服务的 阅读全文
摘要:
由于R版本更迭,网上或旧的教材上的包可能没有在维护,或者被其他包替代。 做一个表记录碰到的一些替代方案。个人向,非完整指南。 * mvpart 2014年之后不再更新,R 3.0版本后无法安装, 提示 package ‘mvpart’ is not available (for R version 阅读全文
摘要:
上午做了个笔试,要求解一道in-place删除数组多余内容的算法题,有O(1)的额外空间要求。 完整的描述忘记了。大致的需求如下: 假设有一个有序数组nums = [1, 1, 1, 2, 3, 5, 5, 5],如果数组中的数字出现超过2次,则删除多余的数字。返回删除后的数组长度。 如 nums 阅读全文
摘要:
参考官方文档中的Module和Glosssary中的描述。Module: https://docs.python.org/3/tutorial/modules.html#packagesGlossary: https://packaging.python.org/glossary/#term-mod 阅读全文
摘要:
跟随官网上的安装教程:https://dev.mysql.com/doc/refman/8.0/en/linux-installation-yum-repo.html官网上还有一个QuickGuide版本: https://dev.mysql.com/doc/mysql-yum-repo-quick 阅读全文
摘要:
在SQL中,insert many的操作可能会出现插入数据量过大的问题。 假设我构造了一个128M的insert语句,SQL或者driver是如何处理的?MySQL Driver对insert语句的数据量大小限制是多少? 翻阅了相关的文档,并没有发现明确的答案。 仅查到配置项中有一个insert_b 阅读全文
摘要:
2018年10月12日 莫名其妙出现cmd下git log中文乱码问题,显示一堆<E4><A8>之类的乱码。git bash却一切正常。 怀疑是Windows系统升级出现的不兼容问题。 把git升级到最新版本,没有解决问题。 参考网上设置 git config --global i18n.logou 阅读全文
摘要:
很遗憾,这还是一个挖坑的问题,解决方案并不是很确定。 需求是,大多数的语言都提供import包或module的功能,避免全部代码写到一个文件中,方便管理与维护。 如常用的database模块,每次写R脚本都需要声明一次数据库连接的话,不仅安全性差,账户密码到处散落,而且修改起来也十分麻烦。 有意思的 阅读全文