摘要: 上一年记录的东西,整理下... 需要代码联系我QQ:1198552415,本人不做义务咨询。 一.哈希检索概述 LSH是Locality Sensitive Hashing的缩写,也翻译为局部敏感哈希,是一种通过设计满足特殊性质即局部敏感的哈希函数,提高相似查询效率的方法。虽然从正式提出距今不过十余 阅读全文
posted @ 2015-07-08 16:24 加拿大小哥哥 阅读(9410) 评论(2) 推荐(3) 编辑
摘要: 好好学数学。 一.问题来源 经朋友介绍,帮一个伙计做了下PSO的优化.......赚点生活费而已。 欢迎大家和我联系做算法类项目,QQ:1198552514 二.背景介绍 2.1 人工生命 人工生命:研究具有某些生命基本特征的人 工系统。包括两方面的内容: 1、研究如何利用计算技术研究生物现象; 2 阅读全文
posted @ 2015-05-22 12:36 加拿大小哥哥 阅读(68731) 评论(7) 推荐(25) 编辑
摘要: 需要代码联系作者,不做义务咨询。需要代码联系我QQ:1198552415,本人不做义务咨询。 一.算法实现 基于p-stable分布,并以‘哈希技术分类’中的分层法为使用方法,就产生了E2LSH算法。 E2LSH中的哈希函数定义如下: 其中,v为d维原始数据,a为随机变量,由正态分布产生; w为宽度 阅读全文
posted @ 2015-05-06 10:03 加拿大小哥哥 阅读(3010) 评论(0) 推荐(1) 编辑
 最近受到南京一个同学的push,又开始了博客园写作之旅。欢迎大家联系我做代码实现工作,QQ:1198552514。权当赚点生活费~

我的研究也经常用的Assignment problem,而且很多问题都能转化为指派问题。比如轮灌和滴灌问题(对喷头分组,每组喷头负责一部分区域,从而使得区域覆盖最大,同时还有很多其他约束),这个问题在国内尚属空白,而且找不到任何代码~笔者已经实现了均衡约束的轮灌、滴灌算法~当时帮新疆的一个同学做的(基于粒子群),没想到我竟然真的做了出来~所以你只要给我数学模型或者说让我听懂你的问题就能帮你做出来

我以前写的非常火爆的粒子群的帖子:  https://www.cnblogs.com/hxsyl/p/4521778.html

1. 问题陈述

指派问题又称分配问题,其用途非常广泛,比如某公司指派n个人去做n件事,各人做不同的事,如何安排人员使得总费用最少?若考虑每个职工对工作效率(如熟练程度等),怎样安排会使总销量达到最大?这些都是一个企业经营管理者必须考虑的问题,所以该问题有重要的应用价值。

假设有n件工作分派给n个人来做,每项工作只能由一人来做,每个人只能做一项工作。若给出各人对各项工作所具有的工作效率。问应该如何安排人选,及发挥个人特长又能使总的效率最大。为此用0-1整数规划来实现指派问题即如何安排人选。

2. 指派问题的背景

在现实生活中,有各种性质的指派问题(Assignment  Problem)。例如,在生产管理中,总希望把人员进行最佳分配,以发挥最大的工作效率;某部门有n项任务要完成,而该部门正好有n个人可以分别去完成其中任何一项,但由于任务性质和个人的专长不同,因此各人完成各项不同任务的效益(所费时间或所花费用)也有差别,如果分配每个人完成一项任务且仅为一项任务,则把每项任务分配给哪个人去完成,使完成所有n项任务的总效益为最高(总时间、总费用为最小或创造的价值最大)?这是典型的分配问题或指派问题。又如有n项加工任务,怎样指定n台机器分别去完成,以使总的加工时间最少或总收入最大;有n条航线,怎样指定n艘船分别航行,使总收入最大,等等,都属于指派问题。

3. 指派问题的描述

3.1 指派问题的一般形式

指派问题的标准形式(以人和事为例)如下。有n个人和n项任务,已知第i个人做第j件事的费用为,要求确定人和事之间的一一对应的指派方案,使完成这n项任务的费用最少。

一般把目标函数的系数写为矩阵形式,称矩阵

 

为系数矩阵(Coefficient  Matrix),也称为效益矩阵或价值矩阵。矩阵的元素(i,j=1,2,…n)表示分配第i个人去完成第j项任务时的效益。一般地,以表示给定的资源分配用于给定活动时的有关效益(时间,费用,价值等),且

 

3.2 问题的数学模型一般形式

 

 

 

在模型中,约束条件式(2)表示每个人只能做一件事,约束条件式(3)表示每件事只能由一个人去做。

            对于问题的每个可行解,可用解矩阵来表示:

 

            当然,作为可行解,矩阵的每列元素中都有且只有一个1,以满足约束条件式(3)。每行元素中也有且只有一个1,以满足约束条件(2)。指派问题n!个可行解。

 

4.指派问题实现

4.1  匈牙利算法

4.1.1 匈牙利算法的理论基础

定理1  如果从分配问题的效率矩阵[]的每一行元素中分别减去(或加上)一个常数,从每一列中分别减去(或加上)一个常数,得到一个新的效率矩阵[],则以[]为效率矩阵的分配问题与以[]为效率矩阵的分配问题具有相同的最优解。

定理2 若矩阵A的元素可以分为‘0’与‘非0’的两部分,则覆盖‘0’元素最少直线数等于位于不同行不同列的‘0’元素的最大个数。

 

4.1.2匈牙利算法的实现步骤

第一步:找出矩阵每行的最小元素,分别从每行中减去这个最小元素;

第二步:再找去矩阵每列的最小元素,分别从各列减去这个最小元素;

第三步:经过这两步变换后,矩阵的每行每列至少都有了一个零元素,接着根据以下准则进行试指派,找出覆盖上面矩阵中所有零元素至少需要多少条直线;

(1)从第一行开始,若该行只有一个零元素打上()号。对打()号零元素所在列划一条直线。若该行没有零元素或有两个以上零元素(已划去的不计在内),则转下一行,一直到最后一行为止;

(2)从第一列开始,若该列只有一个零元素就对这个零元素打上()号(同样不考虑已划去的零元素),对打()号零元素所在行划一条直线。若该列没有零元素或 还有两个以上零元素,则转下一列,并进行到最后一列;

(3)重复(1)、(2)两个步骤,可能出现三种情况:

①  矩阵每行都有一个打()号零元素,很显然,按照上述步骤得到的打()的零元素都位于不同行不同列,因此就找到了问题的答案;

②  有多于两行或两列存在两个以上零元素,即出现了零元素的闭回路,这个时候可顺着闭回路的走向,对每个间隔的零元素打上()号,然后对所有打()号零元素或所有列或所在行划一条直线。

③  矩阵中所有零元素或打上()号,或被划去,但打()号零元素个数小于m。

第四步:为了设法使每行都有一个打()的零元素,就要继续对矩阵进行变换;

(1)从矩阵未被直线覆盖的元素找出最小元素k;

(2)对矩阵的每行,当该行有直线覆盖时,令=0,无直线覆盖的,令=k;

(3)对矩阵的每列,当该列有直线覆盖时,令=-k,无直线覆盖的,令=0;

(4)得列一个变换后的矩阵,其中每个元素=--。

第五步:回到第三步,反复进行,一直到矩阵中每一行都有一个打()的零元素为止,即找到最优分配方案为止。

 

4.1.3 匈牙利算法实现指派问题

为了便于对模型进行求解与分析,假设有4件事4个人去做,各变量对应的数据假设如表1。

表1  每个人完成各项任务需要的时间

任务

A

B

C

D

25

29

31

42

39

38

26

20

34

27

28

40

24

42

36

23

 

 

所以最优解为x11,x23,x32,x44,即甲负责任务A,乙负责任务C,丙负责任务B,丁负责任务D,可以使总花费时间最少。代入求出目标函数值

Z=25+26+27+23=101。

 

4.2  0-1整数规划

0-1规划(0-1 Programming)一种特殊形式的整数规划 。这种规划的决策变量仅取值0或1,故称为0-1变量或二进制变量 ,因为一个非负整数都可以用二进制记 数法用若干个0-1变量表示 。0-1变量可以数量化地描述诸如开与关、取与弃、有与无等现象所反映的离散变量间的逻辑关系、顺序关系以及互斥的约束条件 ,因此0-1规划非常适合描述和解决如线路设计 、工厂选址 、生产计划安排、旅行购物、背包问题、人员安排、代码选取、可靠性等人们所关心的多种问题。实际上,凡是有界变量的整数规划都可以转化为0-1规划来处理。当然也包括运筹学中的指派问题。

 

4.2.1  模型假设

为了便于对模型进行求解与分析,假设有4件事4个人去做,各变量对应的数据假设如表1。

表1  每个人完成各项任务需要的时间

任务

A

B

C

D

25

29

31

42

39

38

26

20

34

27

28

40

24

42

36

23

 

表2  变量假设

i

第i个人

j

第j项任务

 

第i个人分配第j项任务

=1

第i个人被分配去做第j项任务

=0

第i个人不被分配到第j项任务

 

4.2.2  模型建立

               

由此,建立的数学模型为:

5. 进一步思考

  其实实际中每个工人要做多个任务,否则对于发起者来说成本太高了。而且考虑到任务的完成质量,每个任务要由多个人去做~那么该如何实现呢?是不是听起来感觉很简单的样子,做起来又不会做了呢?哈哈哈,这就是我存在的价值~帮您解决您的个性化的问题

 

posted @ 2021-05-28 09:26 加拿大小哥哥 阅读(568) 评论(0) 推荐(0) 编辑
摘要: 我是在差分隐私下看到的,新解决方案的可用性肯定小于原有解决方案的可用性,也就是说信息的后续处理只会降低所拥有的信息量。 那么如果这么说的话为什么还要做特征工程呢,这是因为该不等式有一个巨大的前提就是数据处理方法无比的强大,比如很多的样本要分类,我们做特征提取后,SVM效果很好 ,但是如果用DNN之类 阅读全文
posted @ 2017-11-02 11:48 加拿大小哥哥 阅读(3514) 评论(0) 推荐(1) 编辑
摘要: 页面 和 数据库编码都是UTF-8,但就是奇怪。 指定Tomcat的编码为UTF-8 就行了 阅读全文
posted @ 2017-04-12 17:47 加拿大小哥哥 阅读(409) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2017-03-19 13:13 加拿大小哥哥 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2017-03-18 19:29 加拿大小哥哥 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2017-03-18 19:28 加拿大小哥哥 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 1.注意win下直接复制进linux 改一下--等 先看一下有什么数据库,发现有些数据库,能查询到的数据库才能导入,很奇怪。 2.导入到hdfs 那个数据库 端口号 账户名 密码 那个表 不需要加上驱动 那没指定导入到hdfs的哪,肯定会有默认位置的 可以看出只有map任务 没有reduce任务 创 阅读全文
posted @ 2017-03-17 17:16 加拿大小哥哥 阅读(6400) 评论(0) 推荐(1) 编辑
摘要: ./sqoop export --connect jdbc:mysql://192.168.58.180/db --username root --password 123456 --export-dir '/path' --table t_detail -m 用单引号 不保留原有的变量意思 否则如 阅读全文
posted @ 2017-03-17 17:14 加拿大小哥哥 阅读(656) 评论(0) 推荐(0) 编辑
摘要: 后面加上驱动就ok 阅读全文
posted @ 2017-03-15 11:05 加拿大小哥哥 阅读(3241) 评论(0) 推荐(0) 编辑
摘要: 最近由于要使用Sqoop来到出数据到hdfs,可是发现Sqoop1.4.5跟hadoop2.X不兼容,需要对Sqoop1.4.5进行编译,编译的具体方法见:http://my.codeweblog.com/AlbertHa/blog/318551 如果一切都顺利的话需要就不会遇到什么问题,但是有一个 阅读全文
posted @ 2017-03-15 10:03 加拿大小哥哥 阅读(5265) 评论(0) 推荐(1) 编辑
点击右上角即可分享
微信分享提示