病毒传播的季节性影响因素分析毕业论文
2020-02-13 17:24:08
摘 要
病毒是一种简单的非细胞生物,它们可以引发多种疾病,人类一旦感染此类疾病,在缺乏治疗的情况下会危及生命,且有些病毒引发的疾病是不可治愈的。因此通过研究传染病来研究病毒的传播具有一定的意义。科研工作者们运用多种方法考虑多种因素构建病毒传播体系来研究病毒的传播。本文基于统计学理论与方法来构建病毒传播与气候因素之间的关系,这对病毒传播的研究提供了一个新的视角,有助于病毒传播的防范与控制。
首先,本文通过聚类分析中系统聚类法去研究不同传染病在不同地区的发病率状况,使用离差平方和的方法计算不同类之间的距离,发现本文研究所选取的八种传染病出现了不同地域特征,发病率的影响因素主要分为自然因素和社会因素。根据病毒传播的主要影响因素将这八种传染病分为两类,分析以自然因素为主要影响因素的五种疾病;这五种传染病根据发病率的地域分布特征可以分为三类:东南高西北低、西北高东南低、中部高两侧低。
然后使用回归分析中逐步回归的方法去研究这三类病毒发病率与气候因素之间的关系,构建了三个传染病发病率与多种气候因素之间的多元线性回归模型。发现在每个模型中的气候变量都是不完全相同的,即便出现了相同的变量但其所对应的系数也存在较大差距。说明相同的气候因素对非同一类病毒传播的影响是不同的;病毒传播是受多种气候因素共同影响的;不同种类的病毒所需要的气候传播条件存在差异。
未来可以通过研究不同病毒和气候因素之间的关联性了解病毒的传播情况,按照病毒和气候因素的关系进行分类,了解病毒传播的特性,以便制定更加合理有效的防治措施。
关键词:气候;病毒;传染病发病率;聚类分析;回归模型
Abstract
Virus is a kind of simple of cell biology, they can cause a variety of diseases. Human once infected with these diseases, in the absence of treatment can be life-threatening, and some viruses cause disease is incurable infectious diseases. Researching to study the spread of the virus has a certain significance to the scientific. Research workers use a variety of methods considering various factors virus transmission system is constructed to study the spread of the virus based on the statistics theory and method to build the spread of the virus and the relationship. This provides a new Angle of view, help to prevent and control the spread of the virus
Firstly, this paper uses the systematic clustering method in cluster analysis to study the incidence of different infectious diseases in different regions, and uses the method of squared deviation to calculate the distance. Different regional characteristics have emerged, and the factors affecting the incidence rate are mainly divided into natural factors and social factors. According to the main influencing factors of viral transmission, the eight infectious diseases were divided into two categories. The five infectious diseases can be divided into three categories according to the geographical distribution characteristics of the incidence: southeast It is high in the northwest, low in the northwest, low in the southeast, and low in the middle and high.
Then, the method of stepwise regression in regression analysis was used to study the relationship, and a multivariate linear regression model between the incidence of three infectious diseases and various climatic factors was constructed. It is found that the climatic variables in each model are not exactly the same, even if the same variable appears, the corresponding coefficient beta;_n also has a large gap. It shows that the same climatic factors have different effects on the transmission of non-identical viruses; virus transmission is affected by many climatic factors; different types of viruses require different climate propagation conditions.
In the future, we can understand the spread of viruses by studying the correlation between different viruses and climatic factors, classify them according to the relationship and understand the characteristics in order to formulate more reasonable and effective prevention measures.
Key Words:Climate; virus; incidence of infectious diseases; cluster analysis; regression model
目 录
第一章 绪论 1
1.1 研究背景 1
1.2 目的及意义 2
1.3 传染病简介 3
1.4 国内外的研究现状分析 4
1.5 本文的创新点 5
第二章 基于传染病发病率的聚类分析 6
2.1传染病发病率和气候数据的获取与处理 6
2.1.1 相关指标体系的建立 6
2..1.2 数据的标准化处理 7
2.2基于传染病发病率的系统聚类法 11
2.3.1 系统聚类法的基本思想 11
2.3.2 系统聚类的步骤 11
2.3.3 离差平方和法 12
2.3 聚类分析结果 13
2.4 本章小结 31
第三章 基于传染病发病率的回归分析 32
3.1 传染病发病率与气候因素之间的多元线性回归 32
3.2 病毒性肝炎多元线性回归分析 32
3.3 流行性出血热多元回归分析 40
3.4 流行性乙型脑炎多元回归分析 41
3.5 本章小结 43
第四章 总结与展望 44
4.1 本文总结 44
4.2 未来研究展望 45
参考文献 46
致 谢 47
第一章 绪论
1.1 研究背景
病毒是一种非细胞型生物,只能通过寄生在其他的生物身上才能繁殖生存,在动植物之间广泛传播,造成难以估量的生命财产损失,在很多行业都受到病毒的危害,其中农业受到的危害是最严重的。它可以通过非常多的途径进入人类的身体,如空气、肢体接触、血液、唾液等,当感染病毒之后就会出现各种各样的症状,若不及时就医有可能造成生命危险,当感染某些病毒之后几乎是不可治愈的,如艾滋病病毒(HIV),因此对病毒传播进行相关研究是非常有意义的。本文研究的是病毒传播的季节性影响因素分析,通过控制相关气候因素进而控制病毒传播,或者根据气候状况来预测病毒的爆发[1]。
在查阅了相关资料之后,本文选取了病毒性肝炎、艾滋病、麻疹、流行性出血热、狂犬病、流行性乙型脑炎、登革热、甲型H1N1流感共八种由病毒引起的传染病,这八种疾病充分体现了病毒种类的多样性,也使病毒传播的季节性影响因素分析研究的考虑更加全面,有效的解决了只研究一种病毒类疾病的传播和气候因素之间的关系时所造成的单一性和不合理性。所需要的数据均来源于权威机构网站,其中气候数据来源于国家气象局数据中心中国地面国际交换站气候资料年值数据集(2004-2017),发病率数据来源于2004-2017年间中国卫生和计划生育统计年鉴。这些数据基本覆盖了中国30个省份和自治区(不包括中国香港、澳门、台湾数据),但气候数据中缺乏西藏地区的数据。病例纳入标准为:发病日期为2004年1月1日至2017年12月31日。在此所选的病例都是按照《传染病防治法》进行处理过后的病例,首先通过“中国疾病预防控制信息系统”进行网络报告,然后由疾病预防控制中心工作人员对病例进行审核,删除重复报告、错误报告,杜绝了重复病例、疑似病例及错误病例的干扰,确保了研究数据的真实性和可靠性,为研究分析提供坚实可靠的基础支持。
迄今为止国内外对病毒传播与季节气候之间相关性的研究研究具有了一定的成果,对它们之间的关联程度有了一定的了解,也利用其研究成果在病毒预防控制方面有了一定的建树,更加合理有效的利用了相关卫生医疗资源,减少了不必要的损耗。
1.2 目的及意义
本文主要是利用统计学相关知识,通过收集数据,了解在不同季节,空气温度,湿度,风力等气候因素不同的情况下,传染病发病率在不同地区之间的差异,分析不同因素对病毒传播的影响程度,对这些气候因素进行影响力评估,确定其影响程度大小并且对其进行排序和分类,初步了解气候因素对传染病发病率的影响情况,得出简单的关于气候因素与病毒传播之间的关系,得到初步结论,同时建立一个传染病发病率与气候因素的框架,利用这个框架构建一个包含气温、降雨量、空气湿度等气候因素的数学模型,利用所建立的病毒传播数学模型分析在不同因素条件下病毒传播的具体差异,用更加具有可比性的数值来表现。在了解病毒传播的相关机制之后,结合传染病发病率与气候因素模型得出的结论,提出在病毒防治、疾病控制和疫情检疫等方面的有效建议,来降低病毒对人民群众造成的生命财产危害。
病毒有坏的一方面同时也有好的一方面,某些生物病毒反而会给人类带来一定的益处,例如在医疗卫生行业就可以利用噬菌体可以治疗一些细菌感染;利用牛痘病毒彻底的消灭了天花;腺病毒只会引起呼吸道的轻微感染,可以作为优良的基因治疗载体;甚至我们可以利用艾滋病病毒(HIV)来治疗癌症,因为它相比于一般病毒可以承载更多基因,可以寄生的细胞种类更多。在农业可以利用昆虫病毒可以治疗、预防一些农业病虫害,例如就有利用病毒制作的杀虫剂,相较于其他杀虫剂它对环境造成的污染几乎可以忽略不计且效果更加明显,变相的可以提高农作物产量增加收益;利用病毒还可以具有针对性来消除田间杂草,而不对农作物造成伤害。但有些病毒却危害很大,例如在没有发现牛痘病毒疫苗之前天花病毒就在全球范围内肆虐,致死率达到了恐怖的40%以上,夺走了上亿人的生命;TMV、马铃薯Y病毒在农业上造成难以估量的财产损失。在建立病毒传播的气候影响因素分析模型之后,我们可以更加直观的看到不同温度、降雨量、湿度、风力等情况下对病毒传播造成的影响,对病毒的爆发有了一定的可预见性。然后通过改变相应因素来控制病毒传播,或者在病毒爆发之前提前预知,提前做好相应的准备措施。可以有效的降低病毒传播造成的危害,保护人民群众的生命财产安全,同时可以更加有效合理的利用某些病毒,来解决我们生活生产中的一些问题,如通过一些昆虫病毒来降低农业病危害等。
1.3 传染病简介
传染病能在人与人、动物与动物或人与动物之间相互传播,传染病的基本特点是有病原体,有传染性和流行性,感染治愈之后会永久性获得该疾病的免疫力,有些传染病还有季节性或地方性的特点。传染病的传播和流行必须具备3个环节,即传染源(能排出病原体的人或动物)、传播途径(病原体传染他人的途径)及易感者(对该种传染病无免疫力者)。只要任意阻断其中一个环节就可以预防传染病流行和发生。
在我国出台了专门的法案来防治传染病,《传染病防治法》将我国发病率高的、流行面积大的三十七种传染病列为法定管理的传染病,再结合了我国的实际情况,并且根据传染病的传播方式,传播速度,对人体的危害程度将这三十七种传染病分为甲、乙、丙三类。甲类传染病称为强制管理传染病,是危害最大的一类传染病,包括鼠疫、霍乱,一旦发现必须采取一系列强制措施,实行大面积消毒,控制传染源,切断传播渠道,并且对相关人员还要采取格力措施;乙类传染病称为严格管理传染病,非典就属于这一类传染病,相较于甲类传染病而言危害程度较低,但其传染性依旧很强,如2003年全世界爆发的非典大流行就造成全世界的恐慌;丙类传染称为检测管理传染病,如风寒、流行性感冒、手足口病等其危害程度最低,易于控制[2]。
在本文中选取的传染病都是由病毒引起的。影响传染病发病率的因素有很多,总体可以分为自然因素和社会因素。自然因素包括地容地貌,气候条件和生态环境等诸多因素。特别是经过一些需要虫媒传播的疾病对自然环境极为依赖,如在非洲泛滥的黄热病就需要埃及伊蚊作为媒介来进行传播,每到雨量充沛环境温度适宜蚊虫繁殖的时节,就会出现大规模的黄热病疫情。社会因素包括社会制度,居民文化水平,生活习惯,居住条件,经济条件,人口迁徙等诸多因素。社会因素影响对传染源的影响表现在对动物宿主的管制和消灭,严格的国境安检,完善的传染病预防控制办法等;对传播途径的影响表现在饮水饮食卫生,生活垃圾粪便的处理,空气是否受到污染等;对于易感染人群表现在接种疫苗进行计划性免疫,消灭控制传染病。下面我们就简单介绍一下发病率的计算方法:
发病率表示在一定时间内,一定人群中某病新发生的病例出现的频率。是反映疾病对人群健康影响和描述疾病分布状态的一项测量指标。
发病率=(某时期内某人群中某病新病例人数/同时期内暴露人口数)times;K
(K=100%、1000permil;、10000/万或100000/10万等,观察时间单位可根据所研究的疾病病种及研究问题的特点决定,通常以年表示[3]。)
1.4 国内外的研究现状分析
在上个世纪二十年代的时候,Gill等人就开始研究气候因素与疾病的发病率之间的关系。Gill 等人根据以前疟疾爆发前和爆发时的环境变化情况,选择了利用降雨、肝脏肿大患病率、谷物价格和近五十年之内死于高烧人数的变异系数这些数据进行预测 ,然后成功预测了上个世纪二十年代到四十年代之间疟疾的爆发,其预测的结果真实可靠,并且在一定程度上降低了此次疟疾爆发造成的危害。Gill等人的成功直接推动了季节气候因素和疾病发病率之间的相关性研究,随后Rogers在就在上个时间二十年代中旬发布了气候因素对疾病爆发的影响,分析了温度、降雨、湿度等气候因素同发病率之间的关系。这些早期的研究证明,将气候因素引入疾病爆发预测的模型中可以很大程度提高预测的准确性。在此之后也有越来越多的流行性疾病(例如霍乱、流行性脑脊髓炎、黄热病等)预测研究将气候因素考虑在内。这些研究都说明了一点:气候因素与一些疾病的发病趋势之间存在紧密关系,且某些疾病的爆发一般要在气候要素变动之后的时间发生。因此,将气候因素用于疾病爆发的预测中,将有利于提高预测的精度和准确性。Davis等利用统计分析的方法讨论了温度,绝对湿度和气团频率与流感发病之间的关联,Viboud等·772· 国际中医中药杂志2013年9月第35卷第9期的研究当中分析了准周期的气候模式ENSO和流感发病之间的相关程度,说明了气候因素和流感发病之间存在着紧密的关系。该研究指出强冷ENSO阶段和欧洲冬季的低温及潮湿天气对应,这个时期可能传播流感[4]。郭貔和李克研究了香港地区甲型流感的人群季节性波动与气候条件的相关性,采用了广义相加模型对香港1997-2008年甲型流感的发病情况和气候数据做了研究,发现甲型流感的人群季节性波动与平均气温、相对湿度、平均风速和绝对湿度之间存在复杂的相关性[5]。王晓中和刘洪文在2010年研究了以鼠类作为传播方式传染病与气候因素之间的关系,发现降雨量与此类传染病关系密切,而后利用多种模型来预测各种气候环境下鼠疫的发病趋势,合理的解释了鼠类传播疾病与气候之间的关系[6]。Shilu Tong和Peng Bi研究了影响虫媒病毒传播与气候、环境和社会的变异性之间的关系,发现大量的证据表明,RRV疾病的传播周期对气候和潮汐的变化较为敏感。降雨、气温和涨潮是RRV疾病宏观传播的主要决定因素。说明了气候是影响虫媒病毒传播的主要影响因素 [7]。Hamlet等人在2018发表的关于气候因素对黄热病在非洲传播的影响研究更是直接将温度和降雨量这两个因素放在一起考虑,发现当只有一种环境因素达到最适宜的情况下时,疾病的发病率并不会发生明显的改变,当多个影响病毒传播的环境因素都处于一个适宜的情况下时,疾病的发病率会发生明显的改变。说明了单一气候因素对病毒传播的影响程度相较于将一些气候因素进行整合之后的影响要小的多,病毒的传播是受多种因素共同影响的,只改变单一因素对病毒的传播影响作用不太明显。Xiang, Jianjun和Hansen, Alana 研究发现最大风速抑制登革热传播,气候因素对广州市登革热发病率有显著影响,温度对登革热的滞后效应持续了当地整个流行季节[8]。近几年,关于病毒传播的影响因素的研究发生了突飞猛进的进展,考虑的因素更加的全面,可以看出对病毒传播的气候性影响因素分析已经愈加成熟。
1.5 本文的创新点
本文在国内外学者的研究基础上,首次就由病毒引起的传染病的发病率与各种气候因素就行了更加系统化综合性研究,其主要的创新点包括:
1、本文选取了2004年01月01日到2017到12月31日的年度发病率数据和与之相对应的气候数据,疾病的种类和相关气候因素更加多元化;
2、本文构建了一个综合各方面因素的病毒类传染病传播模型,并且具有一定的预测分析能力,为病毒传播的防治提供了有效的参考意见。
第二章 基于传染病发病率的聚类分析
2.1传染病发病率和气候数据的获取与处理
2.1.1 相关指标体系的建立
本文气候数据是在国家气象局数据中心中国地面国际交换站气候资料年值数据集(2004-2017)中获取的。关于气候特征的数据有很多很多变量,最能反映不同地区之间差异的就是气温和降雨,这两个气候因素构成了气候的基本格局。因此我们首先将年平均气温和降雨量纳入我们的指标体系中,又因为要考虑到一年之中气温的变化,因此年最低气温和年最高气温也需要纳入反映气候的指标体系,降雨量也会影响当地的空气湿度,所以平均相对湿度也要考虑在内。另一方面太阳辐射和大气环流也是影响气候的主要因素,日照的时间长短决定了不同地区热量的差异,间接体现在温度的表现上面,且日照也会影响当地植物的生长速度,间接造成了不同地区地表环境的差异,大气环流这一点可以体现在风速这一点上,所以日照时数和平均风速也应当纳入指标体系。各地区之间海拔不同这一点也应当考虑在内,所以最能反映海拔的气候因素气压也需要纳入指标体系。
综上所述本文一共选取了最低气温(摄氏度(℃))、最高气温(摄氏度(℃))、降水量(毫米)、平均气压(百帕)、平均2风速(米/秒)、平均气温(摄氏度(℃))、平均相对湿度(百分率) 和日照时数(时)这八个气候指标,为了便于计算分析,简记为:,,,,,,。
发病率数据来源于2004-2017年间中国卫生和计划生育统计年鉴,共选取了八种传染病:病毒性肝炎、艾滋病、麻疹、流行性出血热、狂犬病、流行性乙型脑炎、登革热、甲型H1N1流感,将他们的发病率简记为:,,,。这八种传染病都是由病毒引起的,它们的传播方式基本包含了病毒传播的所有方式,同时我们也考虑到了病毒的种类,选择的这八种传染病包含都是有不同的类别的病毒引起的,如HIV病毒就是慢性病毒,狂犬病病毒就是烈性病毒。
2..1.2 数据的标准化处理
本文选用的数据是从2004年到2017年共14年全国30个省份和自治区(不包括中国西藏、香港、澳门、台湾数据)的气候和发病率数据,在此只展示部分经过平均化之后的数据,具体数据见附录。
表2.1 气候因素平均值数据
地区 |
最低气温(摄氏度(℃)) |
最高气温(摄氏度(℃)) |
20-20时降水量(毫米) |
平均气压(百帕) |
平均2分钟风速(米/秒) |
平均气温(摄氏度(℃)) |
平均相对湿度(百分率)
|