结对编程作业--能不能起飞就靠这次了

结对情况

cool_boy
学号：437
海辉
pig_pig
旭
学号：311
pig_link---press

项目链接

来点我啊
有本事你就点啊
求你点点吧
上面三个都一样hhh
好吧其实不一样，第一个是生成程序，第二个是匹配程序

设计说明

类图

API接口设计

public MyC allocate 
{
    public  void Myjson();//读入与处理json数据
    public  void FDmatching();//实现第一次分配
    public  void SDmatching();//实现第二次分配
    public  void TDmatching();//实现第三次分配
    public void  Prin();//输出
}

匹配算法的设计

1. 流程图

性能分析

接下来已s5000-d100为例，先上图

匹配思想

Step1:为了不让后生成的学生的优先级过低导致不能进入部门，首先以高考成绩换算成的评分（随机生成）排名，从高到低排名，给每个人一个rank排名。
Step2:在第一步的前提下，以第一志愿优先原则：从rank为1的学生开始，遍历其第一志愿，当第一志愿对应的部门的人数没有满的情况下，进行匹配判断，匹配判断分为以下两步：
Step 2.1 进行时间判断，将学生的空闲时间段与部门的基础活动时间段进行匹配，当两个时间段中有1个时间段互相匹配（同一时间段或者学生的空闲时间段大于部门的活动时间段），进行下一步判断。
Step 2.2 时间判断满足的情况下，进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比，只要其中有两个两两匹配，即满足判断，更新学生信息与部门信息（学生：加入部门信息、加入部门数部门：成员信息、部门人数、部门人数上限等）
Step3 对所有的学生，依旧按照成绩排名，从rank为1的学生开始，遍历其所有志愿，当其志愿对应的部门的人数没有满的情况下，进行匹配判断，匹配判断分为以下两步：同上
Step 3.1 进行时间判断，将学生的空闲时间段与部门的基础活动时间段进行匹配，当两个时间段中有1个时间段互相匹配（同一时间段或者学生的空闲时间段大于部门的活动时间段），进行下一步判断。
Step 3.2 时间判断满足的情况下，进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比，只要其中有两个两两匹配，即满足判断，更新学生信息与部门信息（学生：加入部门信息、加入部门数部门：成员信息、部门人数、部门人数上限等）
Step 4 最后一轮匹配，对所有的学生，依旧按照成绩排名，从rank为1的学生开始，遍历其所有志愿，当其志愿对应的部门的人数，且学生的已加入部门信息没有该部门没有满的情况下录取。

测试数据如何生成

部门部分

部门名（department_name）：部门名由事先设定好的字符串，通过随机数的组合进行随机生成，由于在下面学生的意向部门中需要用到部门名，因此先用一个字符串数组先存起来。
人数上限(member_limit)：单个，数值，在[0,15]内，这是题目要求，但是考虑到部门的实际情况，一个部门不可能纳新人数0人，而且数字比较小，也比较奇怪，因此我们加上底数限制，范围在[10,15]中，实现方法也比较简单，只要通过一个简单的随机程序，在这个区间内随意生成一个数字即可。
部门特点标签(tags)：首先我们预设9个标签，但是当我们数据测试的时候其实有考虑标签的匹配，如果总标签数少，这一层的匹配率相对来说太高，也就是标签匹配没有发挥作用，因此我们将其扩充到17个，经过测试，效果上有所改善，匹配率下降了2个百分点左右，表明标签匹配发挥了作用。我们的实现方法也比较简单，预取3个目标标签，但是要考虑重复部分，因此在0-16随机生成三个数，经过简单的if去重，得到三个不重复的随机数，作为数组标志，抓取标志。
部门常规活动(schedule_time):最初的想法就是星期输与时间数的随机匹配，时间是控制在10点到23点。这是符合实际情况的，部门工作有一块很重要的内容就是值班，因此需要安排每个时间段都需要人值班，因此部门活动时间是一个跨度比较大的范围。实现方法也是，星期数是预存数组的随机，时间则是在10-21点随机一个数字，后一个是加上2，表示成字符串。

学生部分

学生姓名（student_name）:原先采取和部门名一样的生成方法，生成一个乱码的字母组合来表示，后来可能觉得蛋疼，太蠢了！于是觉得做一点合乎常理的事，名字嘛，就该有正常的姓和名。于是做了三个姓和名的数组，全是将我们班级的人的姓，慢慢打入，还有所有名字拆成两个字，考虑到最终有5000个，因此每个数组分别20、35、38个，总数20 * 35 * 38 > 5000，即直接投入使用。当然会考虑到重复的问题，在下面的模块会简单阐述。
学号（student_number）:作为一个并没有很大影响的标识（因为在名字设立板块采取去重，即无重复名字，因此名字可作为唯一标识），学号这块就主要是0315+8位的随机数组成学号，0315表示数计学院15级学生，也是有良好的寓意的。
兴趣标签（Interests）:本块内容与部门部分的标签相似，不做累赘说明。
绩点（gap）:绩点这块实现难度上就不说了，比较简单，谈谈实际情况。由于福州大学今年绩点改革，因此我们决定跟上潮流，才取阶梯制加上十分制，比如87分、80分和85分的绩点都算作9，65分和60分绩点都算作6.0，也就是不再是一分一绩点，而是一段一绩点的形式。
意向部门（intention_dep）:这一块内容也比较简单，将部门生成名字时存入的数组进行调用，随机产生三个不同的该范围内的随机场，进行调取部门。
可用时间（available_time）:最初的想法和部门常规活动时间一样，最终改变的原因主要有两个，一个是匹配的问题，因为时间以段为单位，在时间生成上产生了11*7=77种可能性，再加上部门和学生的可用时间需要三个标签最终进行匹配，导致匹配率极低；第二个是实际情况，如工作日的10点-17点，很明显是属于学生的学习时间，不太可能将部门活动时间定在这个时间段，正常的可用活动时间段应该控制在工作日的晚上19点-23点，以及周末的一整天，实现方法是在部门的简单随机上，加了两个if的判断，即可实现。

如何评价匹配算法

咳咳,算法方面一定要自我检讨一下了，因为匹配算法是自己写的。算法只考虑了匹配过程的可执行性，在复杂度方面没有做过多的考虑，甚至出现了三层嵌套for循环的情况，结果就是导致在最大的5000students、100departments时，要30几秒才能完成运行，每次都等得自己要疯，队友要打人。对不起队友，对不起老师，对不起国家。。。。。。

（attention)
以上来自写匹配的队友，那我也评价一下，写最终的生成的时候，当时只留了一个5000的数据，每一次改完都是等待1分钟，要抓狂。但是经过问其他同学之后，也有部分同学的复杂度达到了n^3,想想心里平衡了一些。由于我们的匹配算法都是简单的暴力枚举，用最蠢的办法干最酷的事，这也是我们所想或者说能力范围内，当然很多优秀的算法仍然需要我们去学习，希望这个周期不要太长。

关键代码解释

随机生成部分

const char CDH[] = "0123456789";
string form_dnum()//生成部门编号
{
	char ch[nSIZE_CHAR + 1] = { 0 };
	for (int i = 0; i < nSIZE_CHAR; ++i)
	{
		int x = rand() / (RAND_MAX / (sizeof(CDH) - 1));
		ch[i] = CDH[x];
	}
	return ch;
}

这是一段普通的随机数生成程序，全是整个程序的基础，代码比较简单不做过多的复述，但是有个不同，

int x = rand() % (sizeof(CCH) - 1);

这个方法不好, 因为许多随机数发生器的低位比特并不随机,虽然没有太理解这句话，但是听起来很厉害，于是采用上面那种方法。RAND MAX 在ANSI 里#define 在<stdlib.h>
RAND MAX 是个常数, 它告诉你C库函数 rand() 的固定范围。
详情点击此处。

学生名字生成部分

void form_sname(int h)//生成学生姓名
{
	int j = 0;
	map<string, int> mapStudent;
	mapStudent.insert(pair<string, int>("ye haihui", 1));
	for (int i = 2; i <= h; i++)
	{
		int y1 = rand() / (RAND_MAX / (20 - 1));
		int y2 = rand() / (RAND_MAX / (35 - 1));
		int y3 = rand() / (RAND_MAX / (38 - 1));
		string new_name = name_part1[y1] + " " + [y2] + name_part3[y3];
		map<int, string>::iterator it;
		int w1 = mapStudent.count(new_name);
		if (w1 == 0)
		{
			mapStudent.insert(pair<string, int>(new_name, i));
			name[j++] = new_name;
		}
		else i--;
	}
}

这部分的代码主要想说的是map类型的运用，看了很多大佬的hash相关的内容，自愧不如，本部分主要是用于名字生成的去重，先预存一个名字在map中，然后每次随机生成的名字用count进行计数，如果没有，就把这个名字存进去，否则继续随机。对于我来说是个不错的方法，其实仔细一想这个方法有很大的局限性，一个是效率问题，随着基数不断扩大，重复随机的概率将不断提高，假如只剩下一个名字，重复率将无限提升，以目前对map的运用，只能将名字库不断扩大，以增加概率，方法有些取巧，其实并没有从根本上解决这个问题。其次这个方法本质意义上也不叫去重，而是存入无重复的名字。另外曾经尝试过用find函数，可是老是不能成功，看来还需要多多努力。下次将map类型做更深入的理解，同时涉足哈希相关，小白表示压力很大。

还有就是json,这个放在遇到的困难里详细谈一下。还有关于匹配算法，主要是队友完成，但是在筛选标准上两人还是进行深入的讨论。
参博客考也是唯一可用的，对于我的不知道什么情况的vs2015。

运行及测试结果展示

测试500位同学，30个部门的情况
测试1000位同学，50个部门的情况
测试5000位同学，100个部门的情况
输入输出

*测试200位同学，20个部门的情况

s200-d20
link
本次匹配情况良好，所有部门都收到学生，并依据标签时间等严格条件筛选符合部门特色的学生，符合实际情况。

s500-d30
link
所有部门都收到学生，并依据标签时间等严格条件筛选符合部门特色的学生，符合实际情况。

s1000-d50
link
所有部门都收到学生，并依据标签时间等严格条件筛选符合部门特色的学生，符合实际情况。

s5000-d100
link
所有部门都收到学生，并依据标签时间等严格条件筛选符合部门特色的学生，符合实际情况。生成过程较久，但不影响匹配的成功率，匹配的算法描述上面已有描述。

遇到的困难及解决方法

作为生成部分，遇到的困难主要是json的安装、生成两块。

困难描述
--首先对json这个东西，以为和txt的输出一样，一直没太注意。某次无聊了百度了一下，咦？好像有那么点内容，再过了几天，准备开始做了，先动手吧，于是按着教程来，喵喵喵？经过了两天的尝试，竟然毫无进展，当然时间是每天2-3小时的那种。主要问题是不知道问题在哪，整个毫无地方可以入手，三个头文件write、value、read竟然都无法用，一直报各种各样的问题，总之归结起来就是，json.h无法打开，即使打开也无法使用。
尝试及解决--这个做了可就多了，不过后期看来并没有多少有意义，后来找到一篇听起来很有道理的博客，于是进行尝试，果真！成功了！他是采用一次性的方法，将头文件手动插入工程，然后json的头文件也是手动插入，相当于每次新建工程都需要从新配置一下，但是配置的过程并不复杂，无需太多精力，能力有限但是头脑简单的我当然选择这个办法了。
关于json的理解，其实经过几段代码的实践很好理解，json的输出类似一棵树，先定义一个根节点与各节点，赋值的方式也比较直接，同时配合上数组的运用就可以彻底理解透json的输出格式，在json的读入更是符合这个思想，将json按规矩读入然后存到相应的类中。

Json::Value partner_dep;//部门子节点;
Json::Value root;//根节点
Json::Value students;//学生结点
Json::Value departments;//部门节点
root["students"] = Json::Value(students);
root["departments"] = Json::Value(departments);

Json::Value dep;//部门子节点；	
dep["department_num"] = Json::Value(form_dnum());//赋值

root["departments"].append(dep);//数组赋值

//输出到文件
Json::StyledWriter sw;
ofstream os("s5000-d100-in.json", ios::app);
os << sw.write(root);
os.close();

主要的应用如上所示，相信能够很快理解。这也是这次结队编程对于我最大的收获了。同时这次编程有一个更大的收获就是发现自己在这段时间好像变了，对于代码没有原先的那种排斥的感觉，随着熟练度的上升，爱上了研究未知的类和函数，爱上了花一定量的时间专注编程，爱上了运行框上成功运行的快感，仿佛大门被打开了，现在每天都会有意识的去摸索，去编程。这次作业的雏形其实在10.8就完成了，当时以最紧的时间要求自己，后面的天本来想玩耍，但是某次看到自己的代码，真的太蠢了，毫无任何含金量，于是后面的几天开始行动了，将自己的每一部分都尽可能的完善，向舍友请教，有没有更洋气的办法，有没有更好的算法，一次次请教中，了解了map、hash等等用法，也入门级地探索了一波，仿佛有那么点的兴趣。也希望自己在一次次中，找到属于自己的那份热爱。

对队友的评价

（黄旭勿看，价值一顿饭）

如果评价的时间在国庆放假内，那肯定就一个字--坑！2号就在摸索的我，5号他才来学校。来了之后他主要负责匹配的算法的设计，一天他就和我说设计好了，然后我就拿了一组数据给他跑。
炸了！

程序？

不，还有vs！

我的哥，8号下午我在陪他重装！

心里头是******；

某天夜里，1点了，我问他改得怎么样，他说还在改，准备睡了。

***我基本完成了我都还在完善，你还敢早我睡觉。

那天我做到了两点。

但是

也不是都这样的不堪。10月8号以后如果要用一个字来评价，那应该是--切。

如果用三个字--一般般。

五个字--也算还好吧。

后来的两天，不知道是怎的了，他仿佛醒悟了一番，进度特别快，一天后，就做出了一个成品，并且把匹配的算法自行优化了一遍。看着他努力，老夫总算叹了一口气。吾儿终成吾所愿，幸哉！

但是，还没完。。。算了下次再说，毕竟是大作业队友嘛哈哈哈

PSP

PSP	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	20	60
· Estimate	· 估计这个任务需要多少时间	600	600
Development	开发	60	60
· Analysis	· 需求分析 (包括学习新技术)	20	200
· Design Spec	· 生成设计文档	20	30
· Design Review	· 设计复审 (和同事审核设计文档)	20	60
· Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	10	300
· Design	· 具体设计	120	60
· Coding	· 具体编码	500	600
· Code Review	· 代码复审	30	60
· Test	· 测试（自我测试，修改代码，提交修改）	30	100
Reporting	报告	30	120
· Test Report	· 测试报告	30	30
· Size Measurement	· 计算工作量	40	60
· Postmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	20	30
合计		1550	2070

学习进度表

第N周	新增代码	耗时（小时）	重要成长
第一周	100	30	复习了vs2015,、github、回溯思想
第二周	100	30	深入了解了github等用法
第五周	500	30	掌握了json和map的相关用法

posted @ 2017-10-15 18:53 辉哥110 阅读(294) 评论(5) 编辑收藏举报

刷新页面返回顶部

辉哥110