文档详情

广义线性模型

人***
实名认证
店铺
DOCX
11.02KB
约4页
文档ID:426054018
广义线性模型_第1页
1/4

xx 线性模型一、 XX模型的概念以及指数函数族1. 多元线性回归和正态线性模型2. 指数函数族3. The Tweedie distribution:特殊的指数族一员;在0 点有很大的概率并且在非0点有合适的分布;方 差与均值的 p 次幂成正比4.GLM 的结构:连接函数、设计矩阵、预估变量、 offset 变量每个观测的方差取决于:1.模 型的方差方程;2.幅度变量;3.每个变量的权重二、 构建 GLM 模型1. 单因子分析:无法反映变量之间的关系,GLM可以排除这类关系,得到相对数的真实值2. 变量、分类因子、交互项目以及线性预测值:(1)权重/暴露(2) 反应:模型视图预测的值一般地,模型的名称与反应/权重的含义相同(3) categorical factors and naturally ordered value(4)interaction terms:当某种不同变量的特定组合与分别直接乘以不同变量相对数的经验差异很 大时要用到3. 变量估计:通过逆矩阵相关方法求解三、分析因子的显著性1. chi-squared、F-statistics、AIC 等统计量(1)偏离: 比较观测值与设定值之间的差距,考虑到权重的影响,并且当方差小时给予误差更大的影响。

2)偏离度调整(3)chi-squared 统计量: 模型的自由度定义为观测的数量减去变量的数量Nested models:可以利用 chi-squared 来检验偏离度的变化(4)F-statistics(5)AIC:主要用于模型选择的统计量AIC=-2*log likelihood+2*number of parameters是在likelihood与变量数量之间的权衡,AIC数值越小越好2. 模型变量的不确定性Hat matrixLikelihood 的二阶导数与变量的方差反比例相关Steep curvature 表明变量 tightly defined,Shallow curvature 表明变量 poorly defined3. 其他方法(1)与预期值相比: 每种水平下相对值的变动幅度,同时考虑每个水平下得标准偏差,其值的 (2)Comparison with time:model fit line;variation 的大小应该与 exposure 的大小相反 不同渠道数据收集上的差异可能导致不一致的发生四、测试模型的适当性1.残差法偏离残差:xx 了偏度的影响,分布更为正态化xx 残差: 观测值与预测值之间的差异,除以预测值的方差,这个办法使得具有不同均值的观测值可以进行比较,但是没有对分布的形状加以调整2. 残差图: 对于某种模型,如果所选的误差结构是正确的,那么残差的平均值就是0并且残差值的范围3. Cook'sdistanceLeverage: 用于估计数据点对于模型结果的影响五、模型 refinement1.完全交互以及边际交互2.模型限制Restrictions:Compensate:adjust the fitted relativities for correlated factors,using the offset term in the GLMImpose restriction at the risk premium stage:Counterintuitive model results:behavior factorsDistribution of ratio of fitted values between restricted and unrestricted models3. aliasing :linear dependency :(1):Intrinsic aliasing。

下载提示
相似文档
正为您匹配相似的精品文档