预测技术
在展开Gompertz模型趋势预测的说明前,首先给关注统计学知识在软件行业应用的网友介绍趋势预测的基础知识。

如何理解预测技术呢?简单来说,预测(prediction)是根据事物发展的历史资料及当前情况,运用一定的理论和方法,对未来趋势做出的一种科学推测。再简单点,像传说中或是童话里的占卜师一样,当你想知道将来的事情时,你需要告诉占卜师你的出生情况,他能将你的一生预测出来。不同的是,他只能告诉你,你的一生是顺利或是不顺,或再详细点告诉你可能在哪段时间会发生不寻常的事情;而我们所说的预测技术却可以详细到周,甚至详细到天。当然,这里还有个本质的区别,那是我们这里说的预测是有科学基础的,而占卜师的预测只是常常出现在童话里或者传说中罢了。

预测技术的应用主要针对未来的趋势,即是经常讲的趋势预测?这里我们也来个“顾名思义”。“趋势”一词在词典里的解释是“事物发展的动向”,也是会呈现出某种规律。简单点,某一事物未来是好是坏,是多是少,是升是降,或者先好后坏,先多后少,先升后降等等,也是对未来进行预测。再用上面的例子来说明,小李急切地想知道自己的未来,并求助于占卜师,而占卜师则预测到他在40岁时会有场灾祸,那么恐怕小李紧接着要问的是“我该怎样做才能化解我的灾祸”。趋势预测是要解决类似的问题。预测并不是终目的,而是一种手段,当预测到的趋势不符合规定的标准时,应当及时采取措施来进行调整或缓解,这也是趋势预测的目标之一,通过分析预测的结果,揭发它的发展趋势,从而使得人们能够尽早地发现问题,或得到一个科学论断和标准。现在从童话回到现实中来。在软件领域,缺陷的趋势预测是预测技术应用较为广泛的领域之一,它是利用统计的手段来预测产品或解决方案中的遗留缺陷、测试阶段的单位时间内应当查出的缺陷等,因此对软件质量的提高和测试阶段的管理起着重要作用。

在软件领域中,一条重要的原则是“do it right the first time”。这条原则告诉软件行业的工作人员:应当在第一次将事情做对。然而实际中的情况是,软件开发完成后总还是存在缺陷,所以才需要测试,才需要品质保证;考虑业务的复杂性、开发工具的更新、需求的不稳定性、开发人员的能力经验欠缺等因素,几乎不能在第一次将事情完全的做对,取而代之的是不断的验证、测试、修改再确认,才能终确保软件产品或服务的正确性。然而有一件事可以确定,某个软件系统中的缺陷数目应当是一定的,随着软件系统生命周期的推进,发现的缺陷数应当由少到多,再从多到少并趋近于零。那么,如果无法做到“第一次将事情做对”,也要“尽早将事情做对”,在缺陷可能带来巨大的风险之前,将它“扼杀在摇篮里”。如果没有预测,不知道未来趋势,也无法判断当前处于怎样的状态下,更无法知道,在当前阶段,是不是已经有缺陷遗留到了下一阶段。这一点其实很容易理解,本来需要在2周内每天完成30项任务,但第一周只完成了10项,那接下来的一周内需要加班加点完成剩下的50项任务;如果未能完成,那可能导致无法交付任务,带来足以让你后悔的结果。

时间序列预测是预测技术中常见的一种。时间序列是指由同一现象在不同时间上的相继观察值排列而成的数列,形式上由现象经历的时间和现象在不同时间上的观察值两部分组成。时间序列可以分为平稳的时间序列和非平稳的时间序列两种。平稳的时间序列是指基本上不存在趋势的序列;非平稳的时间序列指的是存在趋势的序列。

平稳序列的分析和预测的方法主要有3种,分别为:简单平均法;移动平均法;指数平滑法:

在简单平均法中,t+1期的预测值等于前t期的预测值的平均值,它适用于较平稳的序列,将远期的数据与近期的数据看作对未来同等重要,但现实生活中,往往是近期的数据更加重要。所以,简单平均法的预测结果不够准确。
移动平均法是对简单平均法的改进,通过对时间序列利用“逐期递移”的方式求得一系列平均数作为趋势值或预测值。它的关键在于选择合适的移动步长。简单的移动平均法将每一个值都赋予了相同的权值,也可以使用加权的移动平均法,权值之和为1。
指数平滑法是加权移动平均的一种特殊形式,表现为观察值的时间离现在的时间越远,其权数会呈现指数的下降。
非平稳的、不存在趋势的序列的预测方法有2种:线性的趋势预测和非线性的趋势预测:
线性趋势是指现象随时间的推移而呈现出稳定增长或下降的线性变化规律。它的预测方式是根据小二乘法原理,使实际观察值与预测值的离差平方和小。
非线性趋势是指现象的发展趋势符合非线性曲线的变化规律,如二次曲线、指数曲线(修正指数曲线)、S型增长曲线等等。它的预测方式有小二乘法、三和法、三点法等。