科研-实验和代码遇到的问题
1、自己的算法A在和基准算法B比较结果时,很可能遇到算法A的结果和算法B的结果不同,找bug的思路如下:
(1)基于伪代码,思考问题出现在哪个部分
(2)可能是某个值由于计算方式不同,导致最后的结果不同,举例:
算法A读取数据集,事务数目为x,但是算法B读取数据集,事务数目为y,这步可能是数据预处理不同;
算法A采用支持度判断频繁模式,算法B采用绝对最小出现次数判断频繁模式,这步可能一个用了四舍五入,一个没用四舍五入。
2、多个数据集跑实验时,需要注意
(1)确认在跑的数据集是哪个?
(2)每个数据集不同,代码中的参数要不要改变?
(3)一次执行多个实验点的时候,程序有没有初始化?上一轮的结果有没有影响下一轮结果?