科研-实验和代码遇到的问题

1、自己的算法A在和基准算法B比较结果时,很可能遇到算法A的结果和算法B的结果不同,找bug的思路如下:

(1)基于伪代码,思考问题出现在哪个部分

(2)可能是某个值由于计算方式不同,导致最后的结果不同,举例:

算法A读取数据集,事务数目为x,但是算法B读取数据集,事务数目为y,这步可能是数据预处理不同;

算法A采用支持度判断频繁模式,算法B采用绝对最小出现次数判断频繁模式,这步可能一个用了四舍五入,一个没用四舍五入。

 

2、多个数据集跑实验时,需要注意

(1)确认在跑的数据集是哪个?

(2)每个数据集不同,代码中的参数要不要改变?

(3)一次执行多个实验点的时候,程序有没有初始化?上一轮的结果有没有影响下一轮结果?

posted @ 2023-02-26 19:55  saaas  阅读(9)  评论(0编辑  收藏  举报