Kayden_Cheung - 博客园

2019年4月9日

摘要：传送门阅读全文

posted @ 2019-04-09 20:39 Kayden_Cheung 阅读(233) 评论(0) 推荐(0) 编辑

2019年4月3日

摘要：算法简介算法实现我只是简单处理了一下图像的灰度值，如果要处理RGB值的话，就需要分别进行SVD分解，最后再合起来即可。 import numpy as np from PIL import Image import matplotlib.pyplot as plt def picture_pro 阅读全文

posted @ 2019-04-03 11:17 Kayden_Cheung 阅读(1628) 评论(0) 推荐(0) 编辑

2019年3月24日

MapReduce实现PageRank算法（邻接矩阵法）

摘要：前言之前写过稀疏图的实现方法，这次写用矩阵存储数据的算法实现，只要会矩阵相乘的话，实现这个就很简单了。如果有不懂的可以先看一下下面两篇随笔。 MapReduce实现PageRank算法（稀疏图法） Python+MapReduce实现矩阵相乘算法实现我们需要输入两个矩阵A和B，我一开始想的是两阅读全文

posted @ 2019-03-24 19:38 Kayden_Cheung 阅读(579) 评论(0) 推荐(0) 编辑

2019年3月23日

Python+MapReduce实现矩阵相乘

摘要：算法原理 map阶段在map阶段，需要做的是进行数据准备。把来自矩阵A的元素aij，标识成p条<key, value>的形式，key="i,k",（其中k=1,2,...,p），value="a:j,aij"；把来自矩阵B的元素bij，标识成m条<key, value>形式，key="k,j"（其阅读全文

posted @ 2019-03-23 23:34 Kayden_Cheung 阅读(2006) 评论(0) 推荐(1) 编辑

MapReduce实现PageRank算法（稀疏图法）

摘要：前言本文用Python编写代码，并通过hadoop streaming框架运行。算法思想下图是一个网络：考虑转移矩阵是一个很多的稀疏矩阵，我们可以用稀疏矩阵的形式表示，我们把web图中的每一个网页及其链出的网页作为一行，即用如下方式表示： 1 A B C D 2 B A D 3 C C 4 阅读全文

posted @ 2019-03-23 13:35 Kayden_Cheung 阅读(1610) 评论(0) 推荐(0) 编辑

2019年3月22日

Python初次实现MapReduce——WordCount

摘要：前言 Hadoop 本身是用 Java 开发的，所以之前的MapReduce代码小练都是由Java代码编写，但是通过Hadoop Streaming，我们可以使用任意语言来编写程序，让Hadoop 运行。本文用Python语言实现了词频统计功能，最后通过Hadoop Streaming使其运行在H 阅读全文

posted @ 2019-03-22 09:10 Kayden_Cheung 阅读(2597) 评论(0) 推荐(0) 编辑

2019年3月21日

PageRank算法实现

摘要：基本原理在互联网上，如果一个网页被很多其他网页所链接，说明它受到普遍的承认和信赖，那么它的排名就高。这就是PageRank的核心思想。引用来自《数学之美》的简单例子：网页Y的排名应该来自于所有指向这个网页的其他网页的权重之和，在上图中Y的网页排名就是0.001 + 0.01 + 0.02 + 阅读全文

posted @ 2019-03-21 19:02 Kayden_Cheung 阅读(623) 评论(0) 推荐(0) 编辑

2019年3月7日

支持向量机（Support Vector Machine）：对偶

摘要：前言学SVM看到对偶问题的时候很难受，因为看不懂，数学知识真的太重要了。后来在B站看到某up主的精彩推导，故总结如下。 SVM基本型由之前最大化间隔的计算可得SVM的基本型为： $\underset{\mathbf{w},b}{min}\ \ \ \ \frac{1}{2}\left \| \m 阅读全文

posted @ 2019-03-07 00:10 Kayden_Cheung 阅读(630) 评论(0) 推荐(0) 编辑

2019年3月6日

剑指offer：顺时针打印矩阵

摘要：问题描述输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字，例如，如果输入如下4 X 4矩阵： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10。解题思路以四个变阅读全文

posted @ 2019-03-06 19:50 Kayden_Cheung 阅读(137) 评论(0) 推荐(0) 编辑

2019年3月5日

支持向量机（Support Vector Machine）：超平面

摘要：超平面超平面是 $n$ 维空间的 $n-1$ 维子空间，类似二维空间的直线，三维空间的平面。分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面，将不同类别的样本分开。以二维空间为例：如图所示，若要把图中的红圆和蓝圆分开，有许多直线可以选择，而这些直线的定义就是： $Ax+By+ 阅读全文

posted @ 2019-03-05 13:59 Kayden_Cheung 阅读(1438) 评论(0) 推荐(0) 编辑

2019年3月4日

MapReduce编程：数字排序

摘要：问题描述将乱序数字按照升序排序。思路描述按照mapreduce的默认排序，依次输出key值。代码 package org.apache.hadoop.examples; import java.io.IOException; import java.util.Iterator; import 阅读全文

posted @ 2019-03-04 11:11 Kayden_Cheung 阅读(1112) 评论(0) 推荐(0) 编辑

MapReduce编程：平均成绩

摘要：问题描述现在有三个文件分别代表学生的各科成绩，编程求各位同学的平均成绩。编程思想 map函数将姓名作为key，成绩作为value输出，reduce根据key即可将三门成绩相加。代码 package org.apache.hadoop.examples; import java.io.IOExc 阅读全文

posted @ 2019-03-04 10:03 Kayden_Cheung 阅读(850) 评论(0) 推荐(0) 编辑

2019年3月2日

线性回归（linear regression）

摘要：基本形式最小二乘法估计拟合参数最小二乘法：基于均方误差最小化来进行模型求解的方法称为“最小二乘法”（least square method）即（左边代表 $\mathbf{\omega }$ 和 b 的解）为了计算的方便，可以把常数 b 看出一个特殊的值为 1 的 x 。将 $\mathb 阅读全文

posted @ 2019-03-02 22:06 Kayden_Cheung 阅读(554) 评论(0) 推荐(0) 编辑

pip安装第三方库镜像源选择

摘要：在pip安装时，有些库速度及其缓慢从而导致失败，可以通过更改镜像源的方式来安装。我在安装的时候使用了清华的镜像源，格式如下：想要安装什么库就在后面替换即可。阅读全文

posted @ 2019-03-02 16:03 Kayden_Cheung 阅读(778) 评论(0) 推荐(0) 编辑

2019年2月26日

strcpy函数解析

摘要： char * strcpy( char *strDest, const char *strSrc ) { assert((strDest != NULL)&&(strSrc != NULL)); char *address = strDest; while( (*strDest++ = * strS 阅读全文

posted @ 2019-02-26 15:50 Kayden_Cheung 阅读(330) 评论(0) 推荐(0) 编辑

2019年1月9日

MapReduce编程：单词去重

摘要：编程实现单词去重要用到NullWritable类型。 NullWritable： NullWritable 是一种特殊的Writable 类型，由于它的序列化是零长度的，所以没有字节被写入流或从流中读出，可以用作占位符。比如，在MapReduce 中，在不需要这个位置的时候，键或值能够被声明为Nul 阅读全文

posted @ 2019-01-09 21:33 Kayden_Cheung 阅读(544) 评论(0) 推荐(0) 编辑

Hadoop数据类型

摘要： hadoop包装了java的基本数据类型使他们实现以上的接口而且给予实现细节，这些类都实现了WritableComparable接口，能够在不同的hadoop节点之间毫无障碍的传输了。阅读全文

posted @ 2019-01-09 20:35 Kayden_Cheung 阅读(237) 评论(0) 推荐(0) 编辑

MapReduce编程：词频统计

摘要：首先在项目的src文件中需要加入以下文件，log4j的内容为： log4j.rootLogger=INFO, stdout log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org. 阅读全文

posted @ 2019-01-09 15:37 Kayden_Cheung 阅读(494) 评论(0) 推荐(0) 编辑

2019年1月8日

MapReduce环境配置

摘要：传送门：厦门大学博客阅读全文

posted @ 2019-01-08 17:05 Kayden_Cheung 阅读(368) 评论(0) 推荐(0) 编辑

2019年1月5日

关系数据库、NoSQL和NewSQL数据库产品分类

摘要：阅读全文

posted @ 2019-01-05 21:44 Kayden_Cheung 阅读(689) 评论(0) 推荐(0) 编辑

Kayden_Cheung's Blog

对未来的真正慷慨，是把一切献给现在。

公告