文章快速检索     高级检索
   复旦学报(医学版)  2021, Vol. 48 Issue (1): 47-54      DOI: 10.3969/j.issn.1672-8467.2021.01.007
0
Contents            PDF            Abstract             Full text             Fig/Tab
多项膨胀效应模型对美国城市4~9岁儿童哮喘危险因素的分析
顾丹彤 , 林燧恒     
复旦大学公共卫生学院生物统计学教研室 上海 200032
摘要目的 探讨儿童哮喘的主要危险因素,为哮喘的防治提供参考依据。方法 建立多项膨胀泊松回归模型,获得数据授权,对美国城市合作哮喘研究(NCICAS)1993-1997年中8个主要城市的数据进行分析。结果 共纳入1 376名儿童进行分析。发现控制其他协变量后,年龄每增长1岁,家长汇报患儿气喘的期望天数增加4%;服药次数每增加1次,汇报气喘的期望天数增加7%;与不关心治疗不良反应的家长相比,关心治疗不良反应的家长汇报气喘的期望天数增加12%;以上结果均有统计学意义(P < 0.05)。对汇报气喘天数为0天的膨胀数据研究显示:服药次数越少、就医次数越多、儿童行为表现越差,对家长汇报其气喘天数为0具有正效应; 儿童行为表现越好,对家长汇报患儿气喘天数为14天具有正效应。结论 在调查哮喘症状的危险因素并设计预防和治疗策略时,有必要更加注意基础人群的异质性。对症状严重的儿童进行干预时,心理健康是重要的考虑因素。
关键词哮喘    多项膨胀泊松回归模型    儿童    
Analysis of risk factors for 4-9 years old children with asthma from American cities using multi-inflated effect models
GU Dan-tong , LIN Sui-heng     
Department of Biostatistics, School of Public Health, Fudan University, Shanghai 200032, China
Abstract: Objective To explore the main risk factors of childhood asthma and to provide a basis for designing asthma prevention and treatment. Methods We got the authorization to use the asthma data which were collected from the National Cooperative Inner City Asthma Study (NCICAS) conducted during 1993-1997 in eight major U.S.A. inner-cities.A multi-inflated Poisson regression model was applied to analyze the risk factors of number of days of wheeze. Results A total of 1 376 children were included for analysis.We found that after controlling of the covariates in the Poisson regression model, in general, the number of days child had wheeze due to asthma as reported by the caretaker increased by 4% for each annual increase in age, by 7% for each additional number of medications, and by 12% if parents were concerned about side effects of treatment.All the variables listed above were statistically significant at the 5% alpha level. In the zero-inflated logistic regression model, fewer medications, more medical visits, and lower Child Behavior Checklist (CBCL) scores were positively associated with the caretaker reporting the child having 0 days of wheeze due to asthma; while in the 14-inflated logistic regression model, higher CBCL scores were positively associated with the caretaker reporting the child having 14 days of wheeze due to asthma. Conclusion It is necessary to pay more attention to the heterogeneity of the underlying population when investigating risk factors of asthma symptoms and designing prevention and treatment strategies.Psychological health is an important consideration of interventions especially in children with severe symptoms.
Key words: asthma    multi-inflated Poisson regression model    children    

哮喘是最为常见的儿童慢性呼吸系统疾病,其症状主要为喘息、胸闷、咳嗽等。哮喘发病率逐年升高,已经成为全球最大的公共卫生健康问题之一[1]。20年来,在美国城市儿童哮喘的防治方面并无突破,目前仍无可以治愈哮喘的治疗方案。更好地了解哮喘的危险因素,并及早提供预防方案,已成为控制儿童哮喘的当务之急[2]

为了调查与哮喘症状相关的潜在危险因素,美国城市合作哮喘研究(National Cooperative Inner City Asthma Study,NCICAS)团队在1993年对诊断为哮喘且居住于市中心贫困地区的1 376名儿童进行了9个月的随访,并于基线、3、6和9个月重复测量了4次,研究的主要结局变量之一是患儿在过去2周内气喘的天数,取值范围是0~14的整数。NCICAS是第一个大型的美国城市儿童哮喘病研究,之后的针对美国城市哮喘儿童的研究多是基于此研究结果来设计干预或集中探讨某方面的因素,所包含的危险因素较这个原始数据反而相对较少。由于NCICAS收集到的纵向数据在0值和14值处出现大量堆积,用传统的广义线性模型进行建模可能会导致估计偏倚,并影响对危险因素的估计。

事件发生数中含有大量的零值或其他某一数值时,由于计数资料中某个值过多,且取相同的值时反映的情况不同,常常会导致计数资料的变异度较大,这类现象被称为计数资料的膨胀[3]。这种离散数据的特殊性使其无法用一般的泊松、二项或负二项分布等计数模型来进行预测。多项膨胀模型能解释计数资料中某些过多的值,弥补了普通模型分析膨胀结构数据时的缺陷[4],使得估计结果更加无偏和可靠,并已经用于解决一些传统模型无法回答的实际问题。

NCICAS收集的美国城市哮喘儿童发病因素变量最多,数据最全面。本研究旨在利用NCICAS数据以发现更全面的儿童哮喘危险因素,首次通过建立更适合反应变量的多项膨胀效应模型,以更好地吻合数据分布、减少偏倚,并在此基础上进一步采用单因素及多因素分析挖掘美国城市儿童哮喘发病与危险因素之间的关系,为儿童哮喘的预防提供理论依据。

资料和方法

数据获取及研究对象  本研究的数据来源于美国NCICAS,我们通过美国公开数据政策M-13-13获得NCICAS项目主持人的授权并使用这批数据。NCICAS是一项对美国城市儿童哮喘发病率进行的两阶段研究。该项目收集了1993—1997年关于哮喘症状及有关因素的随访数据,并针对基线收集的数据进行分析[5]。研究对象为美国国家城市合作哮喘研究中被观测的1 376名4~9岁的儿童,由美国北部、中部和东北部气候条件相似的大城市的8个哮喘研究中心招募。

研究变量  该项目中每个家庭在基线检查后再次接受问卷调查,并要求估计过去2周有气喘症状的天数和前3个月计划外就诊或住院的次数。基线调查主要包括被监测儿童的年龄、性别、家庭住址、开始监测时的季节等。

本研究探讨的儿童哮喘影响因素主要包括儿童自身情况、父母或照料者情况及环境因素三方面。其中患儿年龄(age)、父母心理量表(Brief Symptom Inventory,BSI)得分、儿童行为量表(Child Behavior Checklist,CBCL)得分、服药次数(medicine)、就医次数(doctor)、社会支持(support)得分、家庭环境(environment)得分为连续性变量;患儿种族(race)分为3类,黑人、西班牙人、其他种族分别赋值为1、2、3;患儿性别分为2类,男性赋值为0,女性赋值为1;患儿是否过敏(atopic)、患儿出生时是否住进重症监护室(ICU)、患儿哮喘时是否难以得到照料(hard_1)、是否难以得到后续看护(hard_2)、家长是否关心患儿治疗的不良反应(side-effect)、家中是否吸烟(smoke)、是否在冬天进行观测(winter)均为分类变量,是赋值为1,否赋值为0。

统计学方法

描述性分析  我们将患儿按家长汇报的气喘天数分为0天,1~13天和14天3类。分析所研究变量的情况,连续变量描述其均数及标准差情况,分类变量描述其人数及占比情况,描述其分布后检验数据正态及方差齐性,对满足正态性及方差齐性的数据进行χ2检验,对不满足条件的数据进行Kruskal-Wallison检验。

模型拟合与比较传统的用于拟合计数数据最常见的模型是泊松回归(Poisson regression,POI)模型,泊松回归模型要求数据的期望均数等于期望方差。当均数与方差不等时,可以考虑使用负二项回归(negative binomial regression,NB)模型进行拟合。针对本文使用的零值较多且符合泊松分布的过离散(方差明显大于均值)复合计数资料,采用零膨胀及多项膨胀泊松分布模型进行拟合。零膨胀泊松模型(zero-inflated Poisson regression,ZIP)的基本方法是将数据集看成全0数据集A和一个服从泊松或负二项分布的数据集B组成的混合数据集,对混合计数数据建立混合概率分布,用一些特征变量对个体是否真的属于A用Logistic模型进行预测,然后将真实属于A中的个体排除后,构建泊松或负二项分布的计数模型;Logistic部分主要回答协变量影响事件发生与否的问题,泊松或负二项模型部分主要回答协变量影响事件发生次数多寡的问题。多项膨胀泊松模型(multi-inflated Poisson regression,ZKIP)则是在零膨胀模型的基础上再多加一个全n数据集C[6]。泊松、负二项、零膨胀泊松和多项膨胀模型的概率密度函数及其参数见表 1

表 1 不同模型概率密度及其参数 Tab 1 Probability density and parameters of different models
Model Probability density Mean and variance
Poisson regression(POI) $ P\left( Y=y \right)=\frac{{{\lambda }^{y}}{{e}^{-\lambda }}}{y!}, y=0, 1, 2, \cdots $ $ E\left( Y \right)=Var\left( Y \right)=\lambda $
Negative binomial regression(NB) $ P\left( Y=y \right)=\frac{\text{ }\!\!\Gamma\!\!\text{ }\left( y+{{k}^{-1}} \right)}{\text{ }\!\!\Gamma\!\!\text{ }\left( y+1 \right)\text{ }\!\!\Gamma\!\!\text{ }\left( {{k}^{-1}} \right)}\frac{{{\left( k\lambda \right)}^{y}}}{{{\left( 1+k\lambda \right)}^{y+{{k}^{-1}}}}}, y=0, 1, 2, \cdots $ $ \begin{array}{*{35}{l}} E\left( Y \right)=\lambda \\ Var\left( Y \right)=\lambda +{{\lambda }^{2}}k \\ \end{array}$
Zero-inflated Poisson regression model(ZIP) $ P\left( Y=y \right)=\left\{ \begin{array}{*{35}{l}} \pi +\left( 1-\text{ }\!\!\pi\!\!\text{ } \right){{e}^{-\lambda }}, y=0 \\ \left( 1-\pi \right)\frac{{{\lambda }^{y}}{{e}^{-\lambda }}}{y!}, y=1, 2, \cdots \\ \end{array} \right.$ $ \begin{array}{*{35}{l}} E\left( Y \right)=\left( 1-\text{ }\!\!\pi\!\!\text{ } \right)\lambda \\ Var\left( Y \right)=\mu +\frac{\text{ }\!\!\pi\!\!\text{ }}{1-\text{ }\!\!\pi\!\!\text{ }}{{\mu }^{2}} \\ \end{array}$
Muti-inflated Poisson regression model(ZKIP) $ P\left( Y=\text{y} \right)=\left\{ \begin{array}{*{35}{l}} \text{ }\!\!\pi\!\!\text{ }+\text{ }\!\!~\!\!\text{ }\left( 1-\text{ }\!\!\pi\!\!\text{ }-\theta \right){{e}^{-\lambda }}, y=0 \\ \theta +\left( 1-\text{ }\!\!\pi\!\!\text{ }-\theta \right){{e}^{-\lambda }}\frac{{{\lambda }^{y}}}{y!}, y=n \\ \left( 1-\text{ }\!\!\pi\!\!\text{ }-\theta \right){{e}^{-\lambda }}\frac{{{\lambda }^{y}}}{y!}, y\in N\backslash \left\{ n \right\} \\ \end{array} \right.$ $ \begin{array}{*{35}{l}} E\left( Y \right)=\left( 1-\pi -\theta \right)\lambda \\ Var\left( Y \right)=\mu +\frac{\text{ }\!\!\pi\!\!\text{ }}{1-\text{ }\!\!\pi\!\!\text{ }-\theta }{{\mu }^{2}} \\ \end{array}$
k is a dispersion parameter.In particular, when k=0, negative binomial regression and zero-inflated negative binomial models degenerate into Poisson regression and zero-inflated Poisson regression.N is the set of non-negative integers; π and θ are the probabilities of zero and n counts that are not part of the Poisson distribution; λ is the mean of the Poisson distribution.

模型的拟合及参数估计使用统计软件SAS中的过程步PROC NLMIXED完成,相应的代码如下所示。

/*zkip*/

procnlmixed data=data.time0 method=gauss qtol=0.0005 TECH=nmsimp;

parameters a0=-.9 a14=-2.3 b0=1.2;

prob0 = exp(a0+u1)/(1+exp(a0)+exp(a14));

prob14 = exp(a14+u2)/(1+exp(a0)+exp(a14));

mu = exp(b0);

if whzchst=0 then ll = log(prob0+(1-prob0-prob14)*exp(-mu));

else if whzchst=14 then ll = log(prob14+(1-prob0-prob14)*exp(-mu)*(mu**14)/gamma(15));

else ll=log((1-prob0-prob14))-mu+whzchst* log(mu)-lgamma(whzchst+1);

model whzchst~general(ll);

title3 "Zero-14-inflated Poisson Effects Model";

run;

单因素分析  我们向ZKIP模型中的3个部分分别设置连接函数并引入协变量,在零膨胀部分,我们引入额外0概率和期望泊松计数与线性预测指标间的连接函数logit(pi);在14膨胀部分,引入额外14概率和期望泊松计数与线性预测指标间的连接函数logit(qi);在泊松回归部分,引入期望泊松计数与线性预测指标间的连接函数logit(θi)。通过在这些连接函数中引入协变量来构建含有协变量的多项膨胀泊松模型:

$ $\begin{array}{*{35}{l}} \text{log}\left( \frac{{{p}_{i}}}{1-{{p}_{i}}} \right)=logit\left( {{p}_{i}} \right)={{W}_{1}}{{\gamma }_{1}} \\ \text{log}\left( \frac{{{q}_{i}}}{1-{{q}_{i}}} \right)=logit\left( {{q}_{i}} \right)={{W}_{2}}{{\gamma }_{2}} \\ \text{log}\left( {{\mu }_{i}} \right)=X\beta \\ \end{array}$ $

其中W1是零膨胀部分的一个$1376\times c $的协变量矩阵,W2是14膨胀部分的一个$1376\times c $的协变量矩阵,该矩阵除截距项共有c-1个协变量;X是负二项部分的一个$1376\times c $的协变量矩阵,该矩阵除截距项共有c-1个协变量;γ1是零膨胀部分协变量的c×1的回归系数向量,该矩阵除截距项共有c-1个协变量;γ2是14膨胀部分协变量的c×1的回归系数向量,β是负二项部分协变量的c×1的回归系数向量。在单因素分析中W1W2X中同时纳入相同的变量。

多因素分析  通过在W1W2X中同时纳入变量建立模型,并比较各个模型的拟合优度参数AIC、AICC、BIC,选择最优的模型。首先对泊松回归部分加入一系列协变量进行建模,找出泊松部分的最优模型后,在0和14膨胀部分分别加入协变量建模。建立最优模型后,对该模型进行多因素分析,旨在发现实际情况下,多个影响因素并存时,研究变量对发病指标的影响大小,并找出针对不同人群相应的有影响的变量。

统计软件  本研究采用SAS 9.4软件进行分析,所有统计均采用双侧检验,P < 0.05为差异有统计学意义。

结果

研究对象基本特征  我们对1 376名儿童进行基线分析。共有男性儿童508名(36.9%),平均年龄6.24岁,其中328名(64.6%)呈现过敏阳性,152名(29.9%)在冬季监测;共有女性儿童868名(63.1%),平均年龄6.15岁,其中589名(67.9%)呈现过敏阳性,257名(29.6%)在冬季监测。汇报患儿气喘天数为0天、1~13天和14天的3个人群中,儿童行为量表得分、服药次数、就医次数、患儿哮喘时是否难以得到照料、是否难以得到后续看护等方面差异均有统计学意义(表 2)。

表 2 1 376名哮喘儿童的基本特征 Tab 2 Basic characteristics of 1 376 children with asthma  
[x±s or n (%)]
Characteristics Days of wheeze due to Asthma P a
0(n=451) 1-13
n=852)
14(n=73)
Age (y) 6.2±1.8 6.1±1.7 6.2±1.7 0.933
Race (%) 0.899
Black 331 (73.4) 628 (73.7) 57 (78.1)
Spanish 89 (19.7) 169 (19.8) 11 (15.1)
Others 31 (6.9) 55 (6.5) 5 (6.8)
Atopic (%) 347 (76.9) 691 (81.1) 54 (74.0) 0.106
Gender (male%) 176 (39.0) 310 (36.4) 22 (30.1) 0.301
BSI 55.0±11.3 55.9±11.3 58.0±11.2 0.100
CBCL 55.6 (11.7) 57.4±11.5 61.9 (9.61) < 0.001
ICU (yes%) 104 (23.1) 212 (24.9) 22 (30.1) 0.456
Medicine 1.7±1.2 2.1±1.3 2.0±1.4 < 0.001
Doctor 1.2±0.4 1.1±0.3 1.2±0.4 0.007
Hard_1 (yes%) 202 (44.8) 460 (54.0) 41 (56.2) 0.007
Hard_2 (yes%) 192 (42.6) 488 (57.3) 50 (68.5) < 0.001
Side-effect (yes%) 271 (74.7) 587 (79.4) 49 (81.7) 0.156
Support 7.2±2.2 7.1±2.3 6.7±2.4 0.180
Smoke (yes%) 252 (57.0) 495 (58.9) 43 (58.9) 0.811
Environment 5.4±1.5 5.5±1.4 5.4±1.4 0.936
Winter(yes%) 163 (36.1) 268 (30.3) 21 (28.8) 0.082
aχ2 or Kruskal-Wallis test.BSI:Brief Symptom Inventory scores; CBCL:Child Behavior Checklist scores; ICU:Lived in ICU at birth; Medicine:Number of medications; Doctor:Number of doctor’s visit; Hard_1:Hard to get care for asthma; Hard_2:Difficult to get follow-up care; Side-effect:Concern for treatment side effects; Support:Social support score; Smoke:Caretaker smokes; Environment:Family environment score; Winter:Observation was done in winter.

对基线问卷的结局变量(即孩子在2周内的气喘天数)进行分析,据家长汇报情况,气喘的平均次数为2.86,方差为12.67。我们进一步研究发现汇报为0次和14次的人群相对于计数分布的其他次数人群呈现出汇报的高峰,以基线数据为例,0次和14次的占比分别为32.8%和5.3%。

模型拟合比较  本研究所使用的数据明显具有过离散的特征,故而在传统模型拟合的基础上,我们考虑使用零膨胀泊松和多项膨胀泊松模型与传统的泊松及负二项模型进行对比,择优选择最佳的模型进行拟合,拟合结果见表 3。综合考虑模型参数AIC、BIC、AICC均显示多项膨胀泊松模型拟合效果最佳。

表 3 不同模型的拟合优度比较 Tab 3 Comparison of goodness in fit in different models
Goodness of Fit POI NB ZIP ZKIP
AIC (smaller is better) 9 288.0 6 759.6 7 700.4 6 481.1
AICC (smaller is better) 9 288.1 6 759.6 7 700.4 6 481.3
BIC (smaller is better) 9 293.4 6 770.2 7 737.6 6 545.0
AIC:Akaike information criterion; AICC:AIC with a correction for small sample sizes; BIC:Bayesian Information Criterion.

将以上各个模型拟合后的预测频数分布与原始数据的频数分布相比较(图 1),明显可以看出,多项膨胀泊松模型的拟合效果最好。

图 1 各模型拟合分布比较 Fig 1 Comparison of fitted distributions of various models

多项膨胀泊松模型的单因素分析  在0膨胀部分,对于额外0的对数发生比,就医次数具有显著的正效应,儿童行为量表得分和服药次数具有显著的负效应,患儿为女性、在冬天观测的患儿家长更不容易将气喘天数汇报为0次。在14膨胀部分,对于额外14的对数发生比,患儿为女性、哮喘时难以得到治疗、难以得到后续照料、出生时住进重症监护室、在冬天观测的患儿家长更不容易将气喘天数汇报为14天。在泊松部分,患儿的年龄、服药次数具有显著的正效应,女性、过敏、就医次数多、不关心治疗的不良反应、在冬天观测的患儿家长倾向于汇报更少的气喘天数(表 4)。

表 4 多项膨胀泊松模型中患儿气喘天数的单因素分析 Tab 4 Single-factor analysis of the number of days child had wheeze in ZKIP model
Variable PART Estimate P 95%CI
Age 0-inflated 0.005 5 0.883 4 -0.068 4 0.079 4
Gender -0.157 1 < 0.000 1 -1.416 2 -1.028 0
Atopic -1.317 0 < 0.000 1 -1.442 7 -1.191 4
Environment -0.003 9 0.933 9 -0.096 1 0.088 3
Medicine -0.265 8 < 0.000 1 -0.368 7 -0.163 0
Doctor 0.472 0 0.005 2 0.141 0 0.803 0
Race 0.043 4 0.828 4 -0.348 9 0.435 6
Smoke 0.017 4 0.196 7 -0.368 4 0.403 2
Side-effect -0.279 8 0.140 1 -0.554 6 -0.005 0
Hard1 -0.030 7 0.867 1 -0.390 6 0.329 2
Hard2 -0.172 2 0.241 2 -0.460 2 0.115 9
ICU 0.041 5 0.832 6 -0.343 7 0.426 7
Winter -0.125 4 < 0.000 1 -0.165 0 -0.085 9
BSI -0.006 5 0.250 7 -0.017 7 0.004 6
CBCL -0.014 8 0.008 5 -0.025 8 -0.003 8
Age 14-inflated 0.014 6 0.839 8 -0.126 6 0.155 7
Gender -0.375 7 < 0.000 1 -2.501 4 -1.969 5
Atopic -2.538 9 < 0.000 1 -2.745 6 -2.332 1
Environment -0.008 1 0.926 6 -0.179 5 0.163 4
Medicine -0.040 3 0.672 4 -0.227 4 0.146 7
Doctor 0.311 8 0.312 1 -0.293 1 0.916 7
Race -0.711 0 0.014 4 -1.280 1 -0.141 9
Smoke -0.629 6 0.295 9 -1.210 0 -0.049 2
Side-effect -0.572 4 0.2398 -1.042 8 -0.102 0
Hard1 -0.730 3 0.007 5 -1.265 5 -0.195 0
Hard2 -0.529 4 0.032 4 -1.014 4 -0.044 4
ICU -0.607 2 0.040 1 -1.186 9 -0.027 4
Winter -0.359 0 < 0.000 1 -0.431 6 -0.286 5
BSI 0.017 3 0.126 1 -0.004 9 0.039 5
CBCL 0.017 3 0.126 1 -0.004 9 0.039 5
Age Poisson 0.043 2 0.000 3 0.020 1 0.066 4
Gender -0.929 9 < 0.000 1 -0.243 3 -0.125 8
Atopic -0.077 6 < 0.000 1 -0.116 2 -0.039 0
Environment 0.027 5 0.070 6 -0.002 3 0.057 4
Medicine 0.061 2 < 0.000 1 0.031 6 0.090 8
Doctor -0.125 4 0.043 8 -0.247 3 -0.003 5
Race -0.029 4 0.629 2 -0.148 9 0.090 1
Smoke -0.067 4 0.059 6 -0.184 2 0.049 5
Side-effect 0.020 2 0.046 4 -0.070 8 0.111 2
Hard1 0.014 5 0.803 3 -0.099 3 0.128 2
Hard2 -0.010 6 0.823 8 -0.103 5 0.082 4
ICU -0.066 8 0.258 3 -0.182 7 0.049 1
Winter -0.979 9 < 0.000 1 -0.992 2 -0.967 6
BSI -0.001 2 0.492 3 -0.004 6 0.002 2
CBCL -0.001 2 0.492 3 -0.004 6 0.002 2
ZKIP:Muti-inflated Poisson regression model.

多项膨胀泊松模型的多因素分析  我们先对泊松模型加入协变量进行建模,以找到能最好解释泊松部分的协变量,建模过程见表 5,通过后退法逐步剔除上一个模型中无显著统计学意义的变量,并不断比较模型的拟合优度参数AIC、AICC、BIC(3个指标均为越小越好),我们最终选择model 8进行泊松部分的建模。

表 5 泊松部分构建过程——变量及评价参数 Tab 5 Model comparison of poisson part:variables and goodness of fit
Model Count-model -2 Log Likelihood AIC AICC BIC
Model 1 age gender atopic medicine doctor race smoke side-effects winter BSI CBCL 264 016 264 006 264 006 264 004
Model 2 age gender atopic medicine race smoke side-effects winter BSI CBCL 261 016 261 003 261 003 261 003
Model 3 age atopic medicine race smoke side-effects winter BSI CBCL 7 142.5 7 166.5 7 166.8 7 226.0
Model 4 age atopic medicine race side-effects winter BSI CBCL 10 198 10 220 10 220 10 274
Model 5 age atopic medicinesmoke side-effects winter BSI CBCL 10 204 10 226 10 226 10 281
Model 6 age atopic medicineside-effects winter BSI CBCL 8 041.4 8 061.4 8 061.6 8 111.0
Model 7 age atopic medicineside-effects winter 4 476.0 4 492.0 4 492.2 4 532.1
Model 8 age medicineside-effects winter 4 476.4 4 490.4 4 490.5 4 545.4

在选取拟合效果最好的泊松模型后,我们在模型的泊松部分固定使用模型8的变量,即在泊松部分固定纳入协变量年龄、服药次数、家长是否关心治疗的不良反应、是否在冬天观测。然后开始对0和14膨胀部分使用后退法加入协变量建模,建模过程见表 6。进行多次建模尝试后,通过比较模型的评价参数AIC、AICC、BIC,我们最终选择model 7进行最终的建模,最终在模型的0膨胀部分纳入变量性别、过敏、服药次数、就医次数、是否在冬天观测、儿童行为量表得分,在14膨胀部分纳入变量性别、种族、哮喘时难以得到治疗、是否难以获得后续照料、儿童行为量表得分。

表 6 多项膨胀泊松模型构建过程——变量及评价参数 Tab 6 Model comparison of multi-inflated parts:variables and goodness of fit
Model Zero-model K-model -2 Log Likelihood AIC AICC BIC
Model 1 age gender atopic environment medicine doctor race smoke side-effects hard_1 hard_2 ICU winter BSI CBCL age gender atopic environment medicine doctor race smoke side-effects hard_1 hard_2 ICU winter BSI CBCL 106 858 106 932 106 934 107 116
Model 2 age gender atopic medicine doctor race side-effects hard_1 hard_2 winter BSI CBCL age gender atopic medicine doctor race side-effects hard_1 hard_2 winter BSI CBCL 106 089 106 153 106 155 106 313
Model 3 age gender atopic medicine doctor race side-effects winter BSI CBCL age gender atopic medicine race side-effects hard_1 hard_2 winter BSI CBCL 105 612 105 670 105 672 105 815
Model 4 age gender atopic medicine doctor winter BSI CBCL gender atopic race side-effects hard_1 hard_2 winter BSI CBCL 106 181 106 229 106 230 106 349
Model 5 age gender atopic medicine doctor winter CBCL gender atopic race side-effects hard_1 hard_2 winter CBCL 6 766.0 6 810.0 6 810.9 6 921.0
Model 6 gender atopic medicine doctor winter CBCL gender atopic race hard_1 hard_2 winter CBCL 4 855.4 4 895.4 4 896.1 4 996.3
Model 7 gender atopic medicine doctor winter CBCL gender race hard_1 hard_2 winter CBCL 4 855.8 4 893.8 4 894.5 4 989.7
Model 8 gender medicine doctor winter CBCL gender race CBCL 6 766.0 6 798.0 6 798.5 6 878.8
Model 9 gender medicine doctor winter CBCL gender race CBCL 6 766.0 6 794.0 6 794.4 6 864.7
means that the explanatory variable is statistically significant, P < 0.05.

对最优模型进行多因素分析,我们发现在泊松回归部分,控制其他协变量后:年龄每增长1岁,家长汇报患儿气喘的的期望天数增加4%;服药次数每增加1次,家长汇报患儿气喘的期望天数增加7%;与不关心治疗不良反应的家长相比,关心治疗不良反应的家长汇报气喘的期望天数增加12%;与其他季节相比,在冬天进行问卷调查的患儿家长汇报的气喘期望天数减少11%,差异均有统计学意义;对0处的膨胀研究显示,服药次数越少、就医次数越多、儿童行为量表得分越低,对儿童家长汇报其气喘天数为0具有正效应;儿童行为量表得分越高,对儿童家长汇报其气喘天数为14具有正效应,具体分析结果见表 7

表 7 多项膨胀泊松模型中患儿气喘天数的多因素分析 Tab 7 Multi-factor analysis of the number of days child had wheeze in ZKIP model
Variable Part Estimate P 95% Confidence Limits
Gender 0-inflated 0.277 0 0.083 2 -0.036 5 0.590 4
Atopic -0.012 8 0.947 8 -0.396 2 0.370 6
Medicine -0.235 1 0.000 3 -0.363 5 -0.106 6
Doctor 0.502 6 0.012 7 0.107 7 0.897 5
Winter 0.287 0 0.072 7 -0.026 5 0.600 4
CBCL -0.012 5 0.044 2 -0.024 7 -0.000 3
Gender 14-inflated 0.276 0 0.304 0 -0.250 0 0.801 0
Atopic 0.252 7 0.522 7 -0.522 9 1.028 4
Race 0.223 0 0.259 0 -0.164 0 0.609 0
Hard_1 0.148 9 0.885 9 -1.886 9 2.184 7
Hard_2 0.017 4 0.968 8 -0.855 3 0.890 0
Winter -0.280 0 0.336 0 -0.849 0 0.290 0
CBCL 0.033 7 0.005 3 0.010 0 0.057 4
Age 1-13 Poisson 0.040 5 0.001 4 0.015 7 0.065 4
Medicine 0.0692 0.000 1 0.033 8 0.104 7
Side-effects 0.118 4 0.039 8 0.005 5 0.231 2
Winter -0.112 5 0.022 1 -0.208 8 -0.016 2
讨论

本文使用的美国哮喘儿童哮喘病发病数据具有零膨胀数据的特征,在对其进行描述性分析后,我们发现其还具有在某点处的聚集性,符合0_K膨胀分布的特征,这个数据特征是由问卷收集过程中的回忆偏倚和选择偏倚导致的,使用传统的广义线性模型进行分析可能难以得出准确的参数估计,故而我们考虑使用多项膨胀泊松模型分析数据。为了进一步研究对美国家长汇报患儿气喘天数有影响的变量,我们在多项膨胀模型中引入协变量,并构建模型,最终发现年龄、服药次数、家长关心治疗的不良反应是家长汇报患儿气喘天数增多的危险因素;对0处的膨胀研究显示,服药次数越少、就医次数越多、儿童行为表现越差,对儿童家长汇报患儿气喘天数为0具有正效应。儿童行为表现越好,对儿童家长汇报患儿气喘天数为14天具有正效应。

本研究的模型发现了美国哮喘儿童的心理量表得分越高对家长汇报的气喘14膨胀的正效应,一组临床随机对照的干预研究显示哮喘组的儿童行为量表得分显著高于健康组[7],支气管哮喘患儿存在一定的心理损伤,同时哮喘儿童更易出现焦虑、抑郁、退缩等不良心理现象,提示我们在对哮喘儿童进行管理时需要预防心理方面的疾病。目前的哮喘治疗主要采用吸入糖皮质激素,可能会导致患者发生咽部不适、咽炎、口腔念珠菌病等不良反应[8],孩子的服药次数越多、家长对治疗的不良反应越关心,家长越可能存在焦虑与抑郁现象。有研究显示患儿家长的焦虑和抑郁水平检出率显著高于正常群体[9],这可能可以解释在泊松部分期望天数的增加。

模型显示在冬天进行问卷调查的情形下,家长报告患儿气喘的期望天数减少11%,极有可能与冬天过敏源的相应减少有关。以往研究中也明确提出了过敏对哮喘的影响,过敏史一般包括药物过敏及食物过敏,对哮喘儿童而言,这两种过敏往往同时存在,而食物过敏更为常见[10]。食物过敏引发的儿童哮喘约占总发病人数的6%~8%,它能显著增加儿童哮喘的发病率,且呈现出发病率随过敏食物增多而增高的特点[11],对鸡蛋(OR=2.0,P < 0.01)和坚果的食物过敏(OR=2.0,P=0.02)是儿童哮喘的独立危险因素;更有研究结果报告食物过敏的儿童中有45.6%为哮喘病患者[12]。大量研究发现,孕妇及儿童对目前广泛使用的对乙酰氨基酚有过敏反应,且其使用剂量与致哮喘风险呈现出剂量反应关系。研究发现某些存在抗氧化基因缺陷的儿童在使用对乙酰氨基酚后会出现嗜酸粒细胞炎症,且其患哮喘的风险显著增加[13]。过敏阳性的儿童出现哮喘的可能性更高,其父母也更易发现其有气喘的情况,这与本文的研究结果一致。

哮喘儿童的年龄越大,治疗时间越长,被诊断为难治性哮喘的可能性越大[14]。难治性哮喘是指结合使用长效β2激动剂及吸入中高剂量糖皮质激素和两种或更多种的控制药物进行规范治疗至少3~6个月后仍不能得到良好控制的哮喘。若儿童在急性哮喘发作期未得到有效治疗,极易转化为慢性哮喘,病情难以得到缓解,且随年龄增大愈发成为顽疾。另外有研究指出,母婴保护是哮喘的重要保护路径[15],Meta分析指出母乳喂养(OR=0.508,95%CI:0.396~0.653)是儿童哮喘的保护因素[13],其主要原因可能是母乳中包含大量消化寡糖类物质、细胞因子、IgA及长链脂肪酸,可以有效减少婴儿感染并降低特异性反映发生概率[16]。本研究发现儿童年龄越大,父母汇报其气喘的期望天数显著增加,这可能与大龄儿童出现慢性哮喘、难治性哮喘的可能性增加且其来自母乳的免疫功能降低有关。

分析表明,我们的多项膨胀泊松模型更适合于拟合这个存在数值堆积的哮喘数据。该模型拟合数据的预测值更接近实际值、模型的拟合优度更好,通过该模型,我们发现了以往使用传统模型研究中未曾发现的儿童行为量表得分对患儿家长汇报患儿气喘天数的影响,可以为哮喘的预防提供一些理论基础。

作者贡献声明  顾丹彤  数据统计和分析,模型运算,论文撰写和修订。林遂恒  论文构思,数据采集,论文修订。

利益冲突声明  所有作者均声明不存在利益冲突。

参考文献
[1]
VISNESS CM, GEBRETSADIK T, JACKSON DJ, et al. Asthma as an outcome:Exploring multiple definitions of asthma across birth cohorts in the Environmental influences on Child Health Outcomes Children's Respiratory and Environmental Workgroup[J]. J Allergy Clin Immunol, 2019, 144(3): 866-869. [DOI]
[2]
VEETTIL ST, ALNUAIMI ASA. Epidemiology and utilization of primary health care services in Qatar by asthmatic children 5-12 years old:secondary data analysis 2016-2017[J]. Asthma Res Pract, 2019, 5: 3. [DOI]
[3]
贺华. 结构性零和零膨胀模型(英文)[J]. 上海精神医学, 2014, 26(4): 236-242. [CNKI]
[4]
王冰.零_K膨胀泊松模型及其应用[D].辽宁师范大学, 2018.
[5]
MITCHELL H, SENTURIA Y, GERGEN P, et al. Design and methods of the National Cooperative Inner-City Asthma Study[J]. Pediatr Pulmonol, 1997, 24(4): 237-252. [DOI]
[6]
LIN TH, TSAI MH. Modeling health survey data with excessive zero and K responses[J]. Stat Med, 2013, 32(9): 1572-1583. [DOI]
[7]
李茜, 段保全, 张萍, 等. 支气管哮喘儿童的心理特点及护理干预效果评价[J]. 齐鲁护理杂志, 2016, 22(11): 38-39. [DOI]
[8]
孟锐.吸入性糖皮质激素治疗哮喘的疗效和不良反应的Meta分析[D].吉林大学, 2007.
[9]
杨玲慧, 崔焱. 支气管哮喘患儿家长的心理健康状况调查及其与社会支持因素的关系[J]. 现代医学, 2018, 46(8): 930-932. [CNKI]
[10]
冯晓凯.我国支气管哮喘患病情况及相关危险因素的流行病学调查[D].北京协和医学院, 2014.
[11]
唐路路.儿童哮喘的相关危险因素分析[D].大连医科大学, 2013.
[12]
金岩, 张丽颖. 国内儿童哮喘流行病学调查的回归分析[J]. 中华中医药学刊, 2012, 30(6): 1399-1401. [CNKI]
[13]
刘树俊, 王婷婷, 曹世钰, 等. 中国儿童哮喘危险因素的Meta分析[J]. 中国当代儿科杂志, 2018, 20(3): 218-223. [CNKI]
[14]
杨爱君. 《儿童支气管哮喘诊断与防治指南(2016年版)》解读[J]. 中国医刊, 2018, 53(3): 253-257. [DOI]
[15]
贺娟梅, 李小荣, 李复红. 支气管哮喘流行病学观察以及危险因素分析[J]. 山西医科大学学报, 2015, 46(12): 1224-1227. [CNKI]
[16]
郭文卉, 曹玲. 儿童哮喘发病危险因素的研究进展[J]. 北京医学, 2015, 37(6): 571-574. [CNKI]

文章信息

顾丹彤, 林燧恒
GU Dan-tong, LIN Sui-heng
多项膨胀效应模型对美国城市4~9岁儿童哮喘危险因素的分析
Analysis of risk factors for 4-9 years old children with asthma from American cities using multi-inflated effect models
复旦学报医学版, 2021, 48(1): 47-54.
Fudan University Journal of Medical Sciences, 2021, 48(1): 47-54.
Corresponding author
LIN Sui-heng, E-mail:hslynn@shmu.edu.cn.

工作空间