Page 66 - 教授千古 - 1 (5)
P. 66
些伟大的音乐作品陪伴着我度过了那几天几夜,并促成了难以计数的新概念和新思想的诞生,成
为其后十多年里我最终完成自己在统计学领域的全部创造性工作的原始突破和精神动力。
直到这时,我才真正领悟到韩中杰指挥所说的“音乐活动促进人的创造力”的真谛。我深刻地相
信,如果没有那些音乐相伴随,我将无法度过那几乎无眠的六天六夜,也将不可能在阅读、思考
和计算中获得那么多的灵感和思想的突破,而更有可能的是,我很可能无法战胜事后在个人心灵
中萌发的某种足以摧毁我的整个精神世界的强大力量。
我在统计学领域做了三件有创造性的工作。依照时间顺序,首先是在分段回归分析中破除了
对“最优化”算法的迷信,提出用加权期望算法取代最优化算法,因为最优化算子本质上是一个随
机测量,而任何随机变量的最大测量或最小测量在统计上是最不稳定的测量,因而不可“被期
望”,只有对中心期望的测量才是稳定可信的,由此提出了对分段回归分析中的临界点的加权期望
估计的算法。由于对临界点实行加权期望估计,因而可以轻松获得关于临界点的可信区间估计。
但是,在现有的分段回归分析中,则是通过一个所谓的“强制连续性”的假定来解成对构建的联
立方程组,以此获得对每个临界点的随机且单一的点值估计。在这一算法下,对每个临界点的可
信区间估计因此陷入了困境,因为对任何一个统计量的可信区间估计需要有足够数量的随机样本
点并且知道它们的分布形态以及分布的参数。有几位学者甚至尝试用经典的确定性数学的思维模
式和逻辑程序证明这种随机的单点估计服从某种已知的分布类型,但都失败了,因为他们都忽视
了一个基本问题,那就是随机系统不可被人为假定其表现会如何。于是有人提出了用bootstrap
法对已有的样本反复m次随机抽样,以便得到m个临界点,再通过这m个临界点的分布来得到它
的可信区间估计。此方法目前被人翻译为自助法或自举法,而我更愿将它翻译为彼替法,即用另
一个东西来取代一个东西,在统计学里就是用另一个随机变量来取代一个随机变量。这里需要指
出的是,这两个随机变量之间必须是等价的,替代才有意义;否则就是张冠李戴,狸猫换太子。
此外,由于强制性地假定了两个相邻的分段模型在临界点处是“连续的”,也即两个随机的分段
模型在临界点处一定无分毫偏差地连接在一起,因此,在目前流行的统计算法中便不必考虑分段
模型之间的连续性的概率推断问题。这显然违背了统计学处理随机事件的基本原理、逻辑和方
法。即使总体中两个分段模型是连续的,但抽样条件下,它们之间在临界点处一定存在着一个连
接变异,也即两者不会总是在临界点处恰好连接在一起。至于这个连接变异有多大多小,是一个
完全随机的可变量,因而必须进行统计检验并据此做出概率推断。因此,这个所谓的“强制连续
性”假定就是人为地将这个随机可变的连接变异设定为0。尽管人们在纯数学系统内习惯于使用假
定来完成数学命题的推理论证,然而,面对随机系统,在统计学中随意使用这种无其它选项的假
定很可能会铸下大错!可是,一旦取消了“强制连续性”的假定,则针对未知临界点解联立方程组
的数学基础便不复存在,这令那些数学背景的统计学家们感到了无所适从,束手无策。
P a g e 65 | 101