最近的bug列表总结(C++)

最近写了一大段代码,抽象得厉害,容易绕进去,因为写单测的代价很大(借口),所以很多问题到联调的是否才发现。

而且花费了很大的经历才查出来,主要问题有如下几个问题

1. 变量未初始化

具体来说,就是指针之类的,这个是之前遇到的比较多,当前已经很少了,拿出来说是因为这次用上了一个栈上单例(常见的单例,一般是new一个对象)的实现。

因为对其用法理解不深,导致为初始化对象。

2. 绑定端口失败

绑定端口失败后,主线程退出了,然后在启动的线程就core掉了。从core文件分析以为是线程有什么问题,但后来不断地删除代码,最终定位是port绑定失败,换一个端口就好了。

如果早点去看日志,就不必绕这么大的弯了!!

3. 自动完成

写代码时,用到了vim的自动完成功能,导致函数一直返回-1, 示例代码如下

int Class::init(int output, int input)
{
    // arg check
    if (output_)
    {
         return -1;
    }
    .....
}

 这种情况下,编译器完全没有错误提示,只能靠自己小心了。。

4.继承类调用基类同名函数

基本的实例代码如下

class Base {
public:
   int init(int output, int input);
};
class Class : public Base {
int init(int output, int input);
};

int Class::init(int output, int input)
{
    // arg check
    if (output_)
    {
         return -1;
    }
     
    // return Base::init(output, input)
    return init(output, intput);
}

 

继承类同名参数列表调用基类参数列表,本来只是想调用基类的init函数,但由于override了,所以还是会继续调用Class::init(),最终会因为递归栈深度core掉。

此时需要显示的指定调用的为基类函数.

 5. protobuf 通信问题

protobuf

写的程序是server-client模式,cs间通信协议是用protobuf定义的。client 将protobuf封装好,通过tcp发送给server后,server端报解析失败。

这个错误以前也遇到过,问题的根源是,项目中protobuf并不是以同一个模块存在的,而是client和server中均有一个独立的模块。双方需要对协议。

后来查找出的问题是server端protobuf 添加了一个required字段,没有通知client端,导致解析错误

同样这个问题,如果早点看日志的话,调试时间会少很多。因为我们一般在专门的log中查找,并没有去标准输入和输出的日志中去查找错误。而protobuf

解析错误具体的日志信息是放在了标准输入输出中。

 6. 分号问题

其实是一个很傻的问题,在将语句改写为if条件时引入的,具体代码如下

get_return_int(zzz);
->
if (get_return_int(zzz)<0);
{
    printf("negtive something\n");
    return -1;
}
return 0

在if后多了个;导致总是返回-1

7. 溢出

相关代码如下。

int64_t get_file_size(const char* filename)

int file_size = get_file_size("data/westfly")
if (file_size < 0)
{
   printf ("load errro\n");
   return -1;
}
return 0;

加载一份文件,之前小于2G,用int可以保存大小。某一天大于2g了,int就小于0了,导致说加载出错。

8. opt版本core,debug版本不core

现象debug版本中,运行得很好,打开-O2选项,进行opt发布版,运行就core掉了。

根据core文件, info thread

发现线程只有50多个,正常预期应该是150左右。明显某些线程没启动起来。

于是怀疑是主线程粗暴的退出了,导致其它线程访问出错。

添加相关日志,确认了失败的具体位置,经过定位,发现是某个基类函数最后

没有返回值。但外层经过了判断,导致主线程退出了。

 

9. 单线程不core,多线程core

拷贝之前的代码,没有多想,之前的代码中是支持多线程的,但线上居然只配置了一个(坑啊!!)

然后,我这个需求需要其多个来处理,导致core掉。

找了很久,一个个线程的看状态,发现某个资源的mutex被其它线程持有(core文件找问题也需要看机缘啊),

于是分析得到可能是共享变量的问题。

最终定位到从某个全局的资源池获取资源的时候,没有加锁。添加锁后完美解决。

10. protobuf 返回值误用

static bool ParseFromString(const string & input, Message * output);

if(ParseFromString() < 0)

{

}

默认为返回值为int类型,导致出错返回false时,也显示成功。

11. 状态机问题

 

12. 默认参数

程序中用到一个hashmap,插入时value的接口为

insert(key, value, flag=0)

关键是最后一个默认参数,表示当key存在时的处理,

当flag = 0 时,如果key存在,则忽略

当flag=1时,如果key存在,则覆盖。

在程序调用时,直接insert了,采取默认参数0.

而程序reload接口与load 共同调用一个函数。

导致reload时,新value不生效。

13. shell转码问题

为了加密系统,使用了base64编解码,用的是私有的码表,生成了url,通过curl 请求时反解url时,总是缺一些信息,

几次定位才发现url中包含$符号,shell在curl时,将$后的字符转义为变量了,导致为空,将双引号改成单引号就好了。

14. 程序边界问题

某天,接到报警,线上的server down掉了,经过定位,发现是返回值未加判断的问题。

其实,还是接上面一个场景,我以为经过base64加密后,应该就高枕无忧了,在base64反解码的时候,就没有判断是否解码成功,结果

对于某些请求base64反解码的返回值为负值,导致往string中assign时,core掉了。

应该是我们编的url太过显眼,然后被人想方法破解,结果程序就core掉了。还是考虑不周全啊。

 

posted @ 2014-11-22 14:20  westfly  阅读(1188)  评论(0编辑  收藏  举报