曲线拟合
用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。更广泛地说,空间或高维空间中的相应问题亦属此范畴。在数值分析中,曲线拟合就是用解析表达式逼近离散数据,即离散数据的公式化。实践中,离散点组或数据往往是各种物理问题和统计问题有关量的多次观测值或实验值,它们是零散的,不仅不便于处理,而且通常不能确切和充分地体现出其固有的规律。这种缺陷正可由适当的解析表达式来弥补。
公卫百科
数学表述 设给定离散数据
(1)
式中xk为自变量x(标量或向量,即一元或多元变量)的取值;yk为因变量 y(标量)的相应值。曲线拟合要解决的问题是寻求与(1)的背景规律相适应解析表达式
(2)
使它在某种意义下最佳地逼近或拟合(1),ƒ(x,b)称为拟合模型;为待定参数,当b)仅在ƒ中线性地出现时,称模型为线性的,否则为非线性的。量 公卫考场
称为在xk处拟合的残差或剩余,衡量拟合优度的标准通常有
式中ωk>0为权系数或权重(如无特别指定,一般取为平均权重,即(k=1,2,…,m),此时无需提到权)。当参数b)使T(b))或Q(b))达到最小时,相应的(2)分别称为在加权切比雪夫意义或加权最小二乘意义下对 (1)的拟合,后者在计算上较简便且最为常用。
模型中参数的确定 一般的线性模型是以参数 b)为系数的广义多项式,即
, (3)
式中g0,g1,…,gn称为基函数。对诸gj的不同选取可构成多种典型的和常用的线性模型。从函数逼近的观点来看,式(3)还能近似地体现许多非线性模型的性质。
在最小二乘意义下用线性模型(3)拟合离散点组(1),参数b可通过解方程组(i=0,…,n)来确定,即解关于b0,b1,…,bn的线性代数方程组 公卫家园
(4)
式中 (i,j=0,1,…,n),
方程组(4)通常称为法方程或正规方程,当m>n时一般有惟一解。
至于非线性模型以及非最小二乘原则的情形,参数b)可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。
模型的选择 对于给定的离散数据(1),需恰当地选取一般模型(2)中函数ƒ(x,b))的类别和具体形式,这是拟合效果的基础。若已知(1)的实际背景规律,即因变量y对自变量 x的依赖关系已有表达式形式确定的经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型(3)中基函数g0,g1,…,gn(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函数g0,g1,…,gn对模型的适应性起着测试的作用,故又称为测试函数。另一种途径是:在模型(3)中纳入个数和种类足够多的测试函数,借助于数理统计方法中的相关性分析和显著性检验,对所包含的测试函数逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的残差(视为新的离散数据)再次进行,以弥补初次拟合的不足。总之,当数据中变量之间的内在联系不明确时,为选择到相适应的模型,一般需要反复地进行拟合试验和分析鉴别。 公卫家园
参考书目
冯康等编:《数值计算方法》,国防工业出版社,北京,1978。
A.拉尔斯登、H.S.维尔夫著,徐献瑜等译:《数字计算机上用的数学方法》,上海科学技术出版社,上海,1963。(A.Ralston and H.S.Wilf,MatheMatical Methods for Digital Computers,John Wiley & Sons, New York, 1960.)
数学表述 设给定离散数据
(1)
式中xk为自变量x(标量或向量,即一元或多元变量)的取值;yk为因变量 y(标量)的相应值。曲线拟合要解决的问题是寻求与(1)的背景规律相适应解析表达式
(2)
使它在某种意义下最佳地逼近或拟合(1),ƒ(x,b)称为拟合模型;为待定参数,当b)仅在ƒ中线性地出现时,称模型为线性的,否则为非线性的。量 公卫考场
称为在xk处拟合的残差或剩余,衡量拟合优度的标准通常有
式中ωk>0为权系数或权重(如无特别指定,一般取为平均权重,即(k=1,2,…,m),此时无需提到权)。当参数b)使T(b))或Q(b))达到最小时,相应的(2)分别称为在加权切比雪夫意义或加权最小二乘意义下对 (1)的拟合,后者在计算上较简便且最为常用。
公卫考场
模型中参数的确定 一般的线性模型是以参数 b)为系数的广义多项式,即
, (3)
式中g0,g1,…,gn称为基函数。对诸gj的不同选取可构成多种典型的和常用的线性模型。从函数逼近的观点来看,式(3)还能近似地体现许多非线性模型的性质。
在最小二乘意义下用线性模型(3)拟合离散点组(1),参数b可通过解方程组(i=0,…,n)来确定,即解关于b0,b1,…,bn的线性代数方程组 公卫家园
(4)
式中 (i,j=0,1,…,n),
方程组(4)通常称为法方程或正规方程,当m>n时一般有惟一解。
至于非线性模型以及非最小二乘原则的情形,参数b)可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。
公卫人
模型的选择 对于给定的离散数据(1),需恰当地选取一般模型(2)中函数ƒ(x,b))的类别和具体形式,这是拟合效果的基础。若已知(1)的实际背景规律,即因变量y对自变量 x的依赖关系已有表达式形式确定的经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型(3)中基函数g0,g1,…,gn(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函数g0,g1,…,gn对模型的适应性起着测试的作用,故又称为测试函数。另一种途径是:在模型(3)中纳入个数和种类足够多的测试函数,借助于数理统计方法中的相关性分析和显著性检验,对所包含的测试函数逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的残差(视为新的离散数据)再次进行,以弥补初次拟合的不足。总之,当数据中变量之间的内在联系不明确时,为选择到相适应的模型,一般需要反复地进行拟合试验和分析鉴别。 公卫家园
参考书目
冯康等编:《数值计算方法》,国防工业出版社,北京,1978。
A.拉尔斯登、H.S.维尔夫著,徐献瑜等译:《数字计算机上用的数学方法》,上海科学技术出版社,上海,1963。(A.Ralston and H.S.Wilf,MatheMatical Methods for Digital Computers,John Wiley & Sons, New York, 1960.)
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。