摘要:
NoSQL 概述 为什么要用NoSQL? 大数据时代,大数据一般不能够一般的数据库进行分析处理 单机MySQL时代 APP >DAL(数据库访问层) >Mysql(多个) 瓶颈问题 数据量太大,一台机器难以放置 数据的索引 >300w数据量一定要建立索引,不然查询很慢 B+Tree 访问量变大(读写 阅读全文
摘要:
Leetcode Google VIP Plus Dynamic Programming Medium Problems 276 Paint Fence Question: You are painting a fence of n posts with k different colors.You 阅读全文
摘要:
Java 反编译jar 利用IDEA的decompiler插件进行反编译 找到java-decompilar.jar 的目录,cd到该目录下 在目录下输入以下命令 java -cp "/Applications/IntelliJ IDEA.app/Contents/plugins/java-deco 阅读全文
摘要:
Blast Blast使用启发式搜索来找出相关的序列,Blast算法不能够像动态规划保证搜索到的序列和要找的序列之间的相关性,BLAST的工作就是尽可能找出数据库中和所要查询的序列相关的信息而已,精确度稍微低一点。 算法 1 移除Query序列中之低复杂度以及有串街重复现象的区域 低复杂度是指由很少 阅读全文
摘要:
Reservoir Algorithm 蓄水池抽样算法 给定一个数据流,长度为n(从1开始),在只遍历一遍的情况下,能够随机取出m个不同数据的方法 Algorithm 1 若接受的数据量<=m,则直接放入到蓄水池中 2 当接受到第i(i>m)个数据的时候,在[1,i]中随机取得一个随机数d,如果d落 阅读全文
摘要:
BWA Raw:\(ACAACG\) step1:加上$符号,并且$符号的优先级最低 对长度为N的字符序列进行N次循环右移,得到N个字符序列矩阵 按照字典序对这个矩阵的每一行作为基元进行字典许排序 提取矩阵的第一列作为F,最后一列作为L \[ Raw ~~ Matrix \left[ \begin{ 阅读全文
摘要:
身高问题 一群人围成一圈,所有人的身高参差不齐,第一行n为总人数,第二行为n个人的身高,要求求出一种方案,能够保证这个组合中两两之间的身高差的最大值是所有方案中最小的。 输入大概是这样的 4 100 150 200 250 输出 100 方案1:先排序,然后从中找出一个最小的值,放在中间,然后依次取 阅读全文
摘要:
Scanner import java.util.*; class Solution{ public static void main(String[] args) { /** At first Scanner是一个扫描器,我们录取到键盘的数据,先存到缓存区等待读取。 next() 遇到任何一个空白 阅读全文
摘要:
PCA 序言 在模型训练的时候,经常会遇到过拟合的问题,一般而言解决过拟合有很多方法 \[ 解决过拟合 \begin{cases} 增大数据量 &\\ 正则化 &\\ 降维 \begin{cases} 直接降维 (特征选择)&\\ 线性降维 \begin{cases} PCA &\\ MDS & 阅读全文
摘要:
chapter 6 线性回归 目标:找到一个$f(w) = w^Tx$,然后能够拟合数据样本。 最小二乘估计(LSE) 两个角度理解最小二乘法的意义 距离角度的理解 找到一个超平面,然后使得所有的样本距离这个超平面的距离之和最短。 向量空间角度的理解 我们假设不同的样本(N个样本)构成了一个N维度的 阅读全文