摘要: 目的 在做数据分析时,一般需要从数据库中读取数据,然后再交给算法进行分析,最后将结果保存。为了简化分析的过程,我一般会将数据保存在Mysql数据库中,使用SQL进行初步处理、使用MySQL保存中间结果,可以大大的简化数据的维护负担。 本文关注Pandas与MySQL的连接部分 1.安装驱动 我的环境 阅读全文
posted @ 2021-07-31 23:19 ledao 阅读(689) 评论(0) 推荐(0) 编辑
摘要: 模式切换 模式 说明 普通模式 打开文件后默认模式,该模式下可进行光标移动、页面翻转等查看操作;任意模式下按ESC即可退回该模式 可视模式 高亮选中的文本时会进入该模式,常用于选中区域文本;最简单的按v然后移动光标即可选中多行文本 插入模式 即可通过键盘修改文本的模式,编写代码一般处于该模式中;一般 阅读全文
posted @ 2021-07-31 23:18 ledao 阅读(86) 评论(0) 推荐(0) 编辑
摘要: Prophet支持Python和R,我只只体验了Python版本的。 1. Windows版本 我的Windows 10安装测试成功,需要安装的软件包括:1)visual studio 2015 build tools;2)Pystan;3)fbprophet。 踩过的坑为:Windows版本下不支 阅读全文
posted @ 2021-07-31 23:18 ledao 阅读(152) 评论(0) 推荐(0) 编辑
摘要: #### 背景在同构的n个数据中取Top K的最大值或者最小值有很多方法,例如:- 排序后,取前K个或者后K个,算法复杂度为nlog(n);- 维护大小为K的最大(小)堆,最后取堆中的元素,算法 复杂度为nlog(k)。当n很大时,第二种方法可以得到显著的速度提升。本文以C++保准库提供的priot 阅读全文
posted @ 2021-07-31 23:17 ledao 阅读(908) 评论(0) 推荐(0) 编辑
摘要: 要点 简化问题 减少计算量 套路 定义状态 定义动作 定义边界 缓存已知 硬币找零问题 问题:有三种面值硬币1,3,5,且无限量,请问共需要找零n元,最少需要几枚硬币? 定义状态:minCoinNum(n), 即n元需要的最小硬币数目。 定义动作(分而治之):假如我知道了minCoinNum(n-1 阅读全文
posted @ 2021-07-31 23:17 ledao 阅读(36) 评论(0) 推荐(0) 编辑
摘要: Java/Kotlin界的Flask,只是生态还不是很足。像我一样仅仅是提供一个供内部系统使用的接口,还是比较合适的,基于jetty,性能也不会差。 【转载,原文】https://www.oschina.net/news/95263/javalin-1-6-0-released Javalin 1. 阅读全文
posted @ 2021-07-31 23:16 ledao 阅读(2071) 评论(0) 推荐(0) 编辑
摘要: xmake 国产编程语言编译系统,简单易用,网址:https://xmake.io/#/ pybind11 简单易用的C++和Python的双向绑定项目,借鉴boost.python,网址为:http://pybind11.readthedocs.io/en/stable/basics.html x 阅读全文
posted @ 2021-07-31 23:16 ledao 阅读(569) 评论(0) 推荐(2) 编辑
摘要: 目的 在文本查找算法中,BM算法据说是最快的,号称亚线性。网上有很多的介绍,但大部分都是使用c语言构建,而且有些程序根本就不对。这里,经过整理和调试,将可用的kotlin版本贴出来,想用的可直接拿走。 算法简介 有比较好的博客对算法进行了介绍 字符串匹配的Boyer-Moore算法 [## BM算法 阅读全文
posted @ 2021-07-31 22:58 ledao 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 一 目的 在编写程序时,本人使用第二多的数据结构是键值对,通过唯一的key来索引一个可以更加“精密”数据结构。总结来说,在我的产品中,应用较多的两个场景分别是: 通过key-value返回context,例如使用django、spring boot等框架编写后端; 存储大量的结构化信息,通过唯一的k 阅读全文
posted @ 2021-07-31 22:58 ledao 阅读(507) 评论(0) 推荐(0) 编辑
摘要: 目的 在自然语言处理领域,如果我们要在文本中检测特定的词,这就是模式匹配的问题。如果检测多个词,则是多模式匹配。最简单的方法是依次在给定的文本中检测所有感兴趣模式(兴趣词),这样做在兴趣词很多的时候,或者文本很大的时候,其计算复杂度很高,所以就有了AC算法,其计算复杂度相比上述方法降低不少。另外还有 阅读全文
posted @ 2021-07-31 22:57 ledao 阅读(153) 评论(0) 推荐(0) 编辑