OR值的计算方法

OR值的意义可以参考新浪网友“统计遗传”的这篇日志。这里做一些摘抄和修改:

OR值的全称是odds ratio、比值比,对于发病率很低的疾病来说,它是OR值即是相对危险度的精确估计值。OR值的意义:
OR值等于1,表示该因素对疾病的发生不起作用;
OR值大于1,表示该因素是危险因素;
OR值小于1,表示该因素是保护因素。

计算公式如下:假定我们要鉴别因素(例如吸烟)是不是某个疾病的危险因素(例如肺癌)。形成如下四个表:

crosstab

OR值= AD/BC。95%的置信区间就不用公式了,下面用SPSS实现。

SPSS不支持4格表,需要原始的阴性和阳性的数据,即,形式如下(一般情况下,1-是,0-否)。

format_crosstab

使用卡方检验,计算P值,同时可以计算OR值。SPSS里计算OR值的具体方法:

菜单Analyze – Descriptive Statistics – Crosstabs,在弹出的Crosstabs里,Row和Column的框里分别添加吸烟和肺癌两个变量(行列可以相互交换,不影响OR的计算结果)。点击Statistics按钮,弹出对话框,勾选Chi-square和Risk,然后Continue。其他不用管,按下OK按钮进行运算。结果里产生了3个表格:

第1个是数据是否确实等情况和4格表。
第2个可以看到第1行卡方值和检验的P值。根据注释b,看有几个cell(四格表的格子)的预测值小于5,如果有1个(25%)及以上的cell的预测值小于5,则需要看Fisher’s Exact Test一栏的P值,否则就是第1行的卡方检验P值就可以了。
第3个表格的第1行就是OR值了,可以看到OR值和95%CI。