## 背景 修改PG源码时,在elog.c文件中准备调用timestamp.c中的`TimestampTz GetCurrentTimestamp(void)`,以获取当前时间,`TimestampTz`是个int64类型,但是返回值类型不是期望的(是个int32值),但是在另外一个文件postgres.c调用返回的是正常的,如下: ~~~ elog.c: GetCurrentTimestamp() = 3891376011 postgres.c: GetCurrentTimestamp() = 495621643471576 ~~~ 也就是说,同一个函数在不同文件返回值不同! ## 原因调查 首先查看具体函数定义`GetCurrentTimestamp()`,怀疑是elog.c没有宏定义`HAVE_INT64_TIMESTAMP`,随后gdb调试查看,最终计算的结果result确实是int64的值,当这个函数返回之后得到的值却变成了int32的值。 ~~~ TimestampTz GetCurrentTimestamp(void) { TimestampTz result; struct timeval tp; gettimeofday(&tp, NULL); result = (TimestampTz) tp.tv_sec - ((POSTGRES_EPOCH_JDATE - UNIX_EPOCH_JDATE) * SECS_PER_DAY); #ifdef HAVE_INT64_TIMESTAMP result = (result * USECS_PER_SEC) + tp.tv_usec; #else result = result + (tp.tv_usec / 1000000.0); #endif return result; } ~~~ 难道elog.c调用的不是timestamp.c中这个函数?继续在源码中查找这个`GetCurrentTimestamp`函数定义,看是否有多个定义。但是查找的结果是除了这个文件有定义,其他文件都没有这个函数定义,并且在timestamp.c这个函数中添加debug信息也都打印出来了,现在可以确定是函数返回的时候将int64转成int32了。百思不得其解之际,最后在编译日志中发现一个warning: ~~~ elog.c:2245: warning: implicit declaration of function ‘GetCurrentTimestamp’ ~~~ 在网上搜了一下,这种警告是由于函数未声明引起的,但是`GetCurrentTimestamp()`在timestamp.h中声明了,通过对比postgres.c和elog.c include的头文件发现区别:postgres.c包含`#include "utils/timestamp.h"`,也就是在postgres.c 中含有`GetCurrentTimestamp`的函数声明,而在elog.c中却没有。在通过测试发现,C程序如果在函数调用前,没有对函数作声明,则编译系统会把第一次遇到的该函数形式(函数定义或函数调用)作为函数的声明,并将函数类型默认为函数返回值类型! ## 解决方法 在elog.c中添加`#include "utils/timestamp.h"`头文件,并查看编译日志看是否有其他这样的warning。重新配置编译选项,加上-Werror-implicit-function-declaration,将这种warning改成error,提前报错。 ## 总结 对于这个warning需要重视,通过修改编译选项将其变成error,便于我们发现问题,错误发现的越早越好,避免在编译时忽略或者掩盖错误。如果不是这个函数返回值错误特别明显,它将有可能成为一个隐形的bug。