基于结核病预测模型的比较研究 |
2012-08-28 13:03 作者:李清江 来源:硅谷网 HV: 编辑: 【搜索试试】
|
|
硅谷网8月28日消息 《硅谷》杂志2012年第14期刊文称,随随结核病预防体系的不断发展和完善,各种关于结核病各个方面的预测模型也不短兴起。预测对结核病的防治的重要性开始显现。针对在建立预测模型时不能准确判别使用合适的神经网络,归纳几种常用于预测的神经网络:ARIMA模型PSO算法预测模型、RBF神经网络、组合预测模型ARIMA-BPNN模型、ARIMA-GRNN模型,并总结相应的优缺点,及其适用的预测范围。通过对各种预测模型的预测结果进行比较分析。预测结果显示,用单一预测模型进行预测时,因自身的局限,使其预测精度和稳定性不高。而将两种或两种以上的预测模型进行组合预测更能有效提高预测精度,充分的降低预测风险,保证预测结果的稳定性。
结核病发病趋势的预测是结核防治工作中非常重要的一个环节,根据结核病变化规律建立准确的结核病疫情预测模型,能有效预测结核病的发病人数及发病趋势,对结核病的防治工作具有非常重大的意义。目前有多种数学模型被应用于结核病的发病率预测,如指数平滑法、灰色模型法、马尔科夫链预测法、ARMA模型(包括AR,ARMA和ARIMA)等线性预测模型[1],还有BP神经网络,RBF神经网络等非线性的预测模型,近年来又出现了各种线性和非线性组合的预测模型。这些模型都有各自的特点和适用范围。现将目前使用率最高的几种关于结核病预测模型进行比较分析,了解各种预测模型的特点和实用范围,以便人们在进行预测时有目的的进行选择。
1线性预测模型
线性预测模型是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立相应的数学模型,其非线性映射性能较弱,当序列数据不规则性较大时往往难以拟和合适的模型。目前有多种数学模型被应用于结核病的发病率预测,如指数平滑法、灰色模型法、马尔科夫链预测法、ARMA模型(包括AR,ARMA和ARIMA)等线性预测模型,其中ARIMA应用最广。以ARIMA预测模型为例说明线性预测模型的原理和方法。
1.1ARIMA模型建模原理
ARIMA模型又称为B-J模型,它是描述平稳随机序列常用的一种模型。这种模型的基本思想是把预测对象按时间推移形成的数据转换为一组依赖于时间t的随机变量,因为这组随机变量所具有的自相关性,所以这组随机变量能够表明预测对象发展的延续性,然后把这种自相关性随机变量通过合适的数学模型完整的描述出来,通过现阶段已有的可以从时间序列的值代入到数学模型中来预测未来的值[2]。表达式可表示为{xt,t=1,2,…n}。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,可包括AR、MA、ARMA以及ARIMA四种过程。
1.2ARIMA模型建模与预测步骤
ARIMA模型,简记为ARIMA(p,d,q)模型:其中p、d、q分别表示时间序列中的自回归、差分以及移动平均阶数。
当d=0时,ARIMA(p,d,q)模型实际上是ARMA(p,q)模型。
当d=0同时q=0时,ARIMA(p,d,q)模型实际上是AR(p)模型。
当d=0同时p=0时,ARIMA(p,d,q)模型实际上是MA(q)模型。
ARIMA建模与预测包含5个步骤:①序列平稳化处理。序列需为满足ARIMA模型建模的平稳化非随机性序列要求。②模型识别。主要是把握模型的大致方向,为目标序列定阶,也就是确定模型的阶数p和q;③参数估计。估计模型的参数,并检验。④模型诊断。判断所建模型是否可取。⑤预测。是模型实际应用价值的体现,就是利用所选取合适参数的模型进行预测。
1.3ARIMA模型特点
从短期来看,ARIMA模型在结核病发病率的预测上准确率比较高,具有一定的可信度,从长期来看,ARIMA模型还存在一些不足之处,随着时间的延长,其预测误差会逐渐增大,可信度变低。
2非线性预测模型
结核病发病率实际上受多种因素影响,具有不规则、不确定、区域性等非线性特征,利用传统的线性数学模型难以对发病率和发病趋势进行理想的预测,预测效果也不能让人满意。所以今年来又出现了很多针对这种非线性特点的结核病预测模型。如蚁群算法预测模型,PSO算法预测模型,以及应用最多的神经网络预测模型(ANN、RBF)。以RBF神经网络为例说明非线性预测模型的原理和方法。
2.1RBF神经网络原理
RBF神经网络是一种复杂的非线性预测系统,它是由大量的功能简单的处理单元相互连接而成,也是对大脑神经网络结构和功能的初步模拟。它的处理方法属于隐式数学,是一种典型的黑箱建模工具,它只需给出预测对象所需的输入和输出数据,通过大脑神经网络本身的学习功能就可以得到输入与输出的映射关系,不需要建立数学模型,一般事先也不必知道有关建模对象的结构和具体的参数。它通过网络训练从数据中概括出来的结果,以多组权值和阈值的形式,分别存储于各个神经元中,然后再构成网络知识,利用该知识来预测相似因素的结果[3]。RBF神经网络任何一个时间序列都可以作为一个由非线性机制确定的输入和输出系统,也就是将时间序列当做一个输入与输出非线性映射关系,通过神经网络实现非线性映射的逼近,最后用于开展关于时间序列数据的预测分析。
2.2RBF神经网络特点
RBF神经网络学习速度快的特点,非常适于在线实时控制,现已证明RBF神经网络能以任意精度逼近任一连续函数,具有唯一最佳逼近特性,无局部极小等特性[4]。RBF神经网络函数具有逼近能力较强,学习速度较快的特点,网络输出与初始权值无关,网络结构能够自适应确定,避免了局部最优,加快了计算速度,因而将它应用于复杂的时间序列预测会取得较好的效果[5]。
3组合预测模型
组合预测模型是未来预测模型发展的一个必然趋势,也是现阶段研究和应用最多的一种预测方法,它是把两种或两种以上不同的预测模型通过数学方法建立一定的数学关系,然后对同一对象进行预测,并对各单独的预测结果进行适当加权综合处理。因为组合预测模型中包含各个单个预测方法的有用信息,充分利用了各个模型的有点,所以能够有效的提高预测精度和预测结果的稳定性。建立一个准确而有效的组合预测模型的关键是如何准确的确定每单个预测模型的权系数。常见的组合预测模型有ARIMA-BPNN模型,ARIMA-GRNN模型等。
3.1组合模型工作原理
组合预测模型是把把各个预测模型的预测结果作为输入向量,将与预测结果相对应的实际值作为输出,然后用大量的训练样本训练这个组合网络,使组合模型的预测结果与实际值之间建立一种非线性映射关系。这种映射关系所构成的新的组合网络经过不断地学习及测试,在达到较高的预测精度之后,该网络就可以作为一种非线性组合预测的有效工具,用于对未来结核病发病趋势预测并得到最终结果[6]。
3.2组合模型特点
经过对各种单个预测模型和组合模型的预测结果进行比较可以看出,组合模型可以有效的利用各个单个模型的特点,来确定合适的权重系数,实现预测结果与实际值非常接近,形成一种有效的预测模型。各种预测结果表明组合预测模型的预测结果比单项预测模型的预测结果精度高、稳定性强得多。
4结论
本文综合介绍了几种基本预测方法的原理和特点,通过对几种预测模型的预测结果进行比较研究得出,组合预测模型的预测精度比单一模型高,预测结果比单一模型稳定,可以充分的降低预测风险。因此在建立预测模型的时候最合理的选择就是组合模型,也就是把上述的两种或两种以上的模型综合运用,所取得的精确度会更好,稳定性也会更好。当然组合预测模型也不是完美无缺的,因为组合预测模型是采用多种预测方法对同一种数据进行预测,并对数据进行加强综合处理,然后产生一种组合的预测模型,这个过程中必然要忽略一些数据的特点,也就是产生一些误差,并带到最终的预测结果中,从而影响到结果的精度。所以关于结核病预测模型虽然已经有了很大的发展和进步,但还需要我们不断的研究探索新的预测方法,最终得到理想的预测结果。
项目资金:黑龙江省教育厅科学技术研究项目资助(NO:12511622)(原文载于《硅谷》杂志2012年第14期,硅谷网及《硅谷》杂志版权所有,未经允许禁止转载) |
|
|
|
【对“基于结核病预测模型的比较研究”发布评论】 |
版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
|
|
|
|