《多元回归r案例剖析》由会员分享,可在线阅读,更多相关《多元回归r案例剖析(13页珍藏版)》请在金锄头文库上搜索。
1、棉花的纤维强力,13级统计学,棉纤维的简介,棉纤维是我国纺织工业的主要原料,主要成份是纤维素,其元素组成为碳44.44%、氢6.17%、氧49.39%。棉纤维的聚合度在600011000间,其组成与长度、线密度、成熟度有关。棉纤维长度是指纤维伸直时两端间的距离,是棉纤维的重要物理性质之一。棉纤维的长度主要由棉花品种、生长条件、初加工等因素决定。棉纤维长度与成纱质量和纺纱工艺关系密切。棉纤维长度长,整齐度好,短绒少,则成纱强力高,条干均匀,纱线表面光洁,毛羽少。 棉纤维的线密度是指纤维的粗细程度,是棉纤维的重要品质指标之一,它与棉纤维的成熟程度、强力大小密切相关,且还是决定纺纱特数与成纱品质的主
2、要因素之一,纤维较细,则成纱强力高,纱线条好。 棉纤维的成熟度是指纤维细胞壁的加厚程度,即棉纤维生长成熟的程度正常成熟的棉纤维,截面粗、强度高、转曲多、弹性好、有丝光、纤维间抱合力大、成纱强力也高。 棉纤维的强度是纤维具有纺纱性能和使用价值的必要条件之一,纤维强度高,则成纱强度也高。,案例分析,某地区所产原棉的纤维强力Y与纤维的公制支数X1(指单位质量(g)的纤维所具有的长度(m)、纤维成熟度X2有关,数据如下:,R程序,library(foreign) w=read.csv(“02211.csv“ ) #建立以Y为因变量,X1、X2为自变量做线性回归 A=lm(YX1+X2,data=w)
3、summary(A) 输出结果:Call: lm(formula = Y X1 + X2, data = w) Residuals: Min 1Q Median 3Q Max -0.14092 -0.05819 -0.03905 0.02181 0.20788,Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 6.595e+00 1.120e+00 5.889 0.000105 * X1 -5.106e-04 9.623e-05 -5.306 0.000250 * X2 2.155e-01 3.946e-01 0.546
4、 0.595816 Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 残差标准差、决定系数及回归方程的显著性检验结果: Residual standard error: 0.1225 on 11 degrees of freedom Multiple R-squared: 0.9163, Adjusted R-squared: 0.9011 F-statistic: 60.24 on 2 and 11 DF, p-value: 1.186e-06 自变量X1的回归系数在0.05的显著水平下是显著的,且 该回归方程是显著的。,方差分析 anova(A)
5、 Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(F) X1 1 1.80340 1.80340 120.1791 2.93e-07 * X2 1 0.00448 0.00448 0.2984 0.5958 Residuals 11 0.16507 0.01501 - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1,标准化数据回归分析及散点图 w=as.matrix(w) stdx=scale(w,2:4,center=TRUE,scale=TRUE) stdx
6、=as.data.frame(stdx) B=lm(YX1+X2,data=stdx) summary(B) attach(stdx) par(mfrow=c(2,2) plot(YX1) abline(lm(YX1) plot(YX2) abline(lm(YX2),在实际问题中,不同变量的测量单位往往是不一样的。这就是所谓的量纲,而不同的量纲会引起各变量取值的分散程度和均值的差异较大。所以不能由偏回归系数的大小直接说明自变量对因变量线性影响的大小。,回归方程为 且方程是显著的。,从该散点图可以看出,自变量的分布趋势大致在一条直线上,且与因变量负相关,自变量与因变量呈正相关。,两个散点图:,
7、绘制残差图、标准化残差图和残差图 resid=residuals(B) stdresid=rstandard(B) C=predict(B) par(mfrow=c(2,2) plot(C,resid) plot(C,stdresid) plot(B,2),通过残差图大概可以看出,以上的样本的标准残差都在到之间且图上的点近似的在一条直线附近,所以可认为样本数据来自正态分布的总体。,所以知道该拟合的回归模型 具有合理性与可靠性。,w1.x=data.frame(X1=-0.48,X2=0.42) w1.y=predict(B,w1.x,interval=“prediction“,level=0.95) w1.y,若已知一组标准化后数据X1=-0.48,X2=0.42,用拟合的线性模型预测Y的值及置信水平为95%的置信区间。,输出结果: w1.y fit lwr upr 1 0.4599869 -0.2623089 1.182283,总结,棉花的纤维强力与纤维的公制支数密切相关,公制支数越高,纤维越细,强力变小,且纤维成熟度越高,纤维强力也就越高。,