统计分析基础知识

上传人:hs****ma 文档编号:504676006 上传时间:2023-03-08 格式:DOC 页数:11 大小:539.50KB
返回 下载 相关 举报
统计分析基础知识_第1页
第1页 / 共11页
统计分析基础知识_第2页
第2页 / 共11页
统计分析基础知识_第3页
第3页 / 共11页
统计分析基础知识_第4页
第4页 / 共11页
统计分析基础知识_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《统计分析基础知识》由会员分享,可在线阅读,更多相关《统计分析基础知识(11页珍藏版)》请在金锄头文库上搜索。

1、一. 统计学中数据类型在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数 据,定比变量。1定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类 别上的不同变量,仅仅是一种标志,没有序次关系。例如,”性别“,”男“编码为1, ”女“编码为2。2定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位 置,不能做四则运算。例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。3定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运 算,不

2、能做乘除运算。例如,温度。4定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点,例如职工人数, 身高。不同测度级别的数据,应用范围不同。等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的 数据的功能。李克特量表李克特量表又称分项评分量表,时由美国社会心理学家Rensis A.Likert于1932年提出的。李克特量表的度量级别,通常是5级,在应用中7级,9级均可,但通常不少于 5级,不高于9级。归一化在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1-+1之间是统计的坐标分布。即该函数在(-8,+ *的

3、积分为1线性函数转换如下y=(x-Mi nValue)/(MaxValue-Mi nV alue)说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。(x-mi n)/(max-mi n)这样所有的数据都归一化为0到1之间的数了归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1-+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论 是为了建模还是为了计算,首先

4、基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;SVM是以降维后线性划分距离来分类和仿真的,因此时空降维归一化是统一在-1-+1之间的统计坐标分布。归一化是因为sigmoid函数的取值是 0到1之间的,网络最后一个节点的输出也是如 此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用0.9 0.1 0.1就要比用要好。但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。主要是为了数据处理方便提出来的,把数据映射到01范围之内处理,更加便捷快速,应该归到数字信号处理范

5、畴之内。归一化方法 (Normalization Method)1。 把数变为(0, 1)之间的小数 主要是为了数据处理方便提出来的,把数据映射到0 1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。2。 把有量纲表达式变为无量纲表达式归一化是一种简化计算的方式,即将有量纲的表 达式,经过变换,化为无量纲的表达式,成为纯量。比如,复数阻抗可以归一化书写:Z = R + j 3 L = R(1 + j 3 L/R),复数部分变成了纯数量了,没有量纲。标准化方法(Normalizati on Method)数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。 由于信用指标体 系的各

6、个指标度量单位是不同的, 为了能够将指标参与评价计算, 需要对指标进行规范 化处理,通过函数变换将其数值映射到某个数值区间。关于神经网络(matlab )归一化的整理关于神经网络归一化方法的整理由于采集的各数据单位不一致,因而须对数据进行-1 , 1归一化处理,归一化方法主要有如下几种,供大家参考:(by james )1、线性函数转换,表达式如下:y=(x-Mi nV alue)/(MaxValue-Mi nV alue)说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。2、对数函数转换,表达式如下:y=log10(x)说明:以10为底的对数函数

7、转换。3、反余切函数转换,表达式如下:y=ata n( x)*2/PI归一化是为了加快训练网络的收敛性,可以不进行归一化处理归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是统一在0-1之间的统计概率分 布;当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加 或减小,从而导致学习速度很慢。为了避免出现这种情况,加快网络学习速度,可以对 输入信号进

8、行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。归一化是因为sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是 如此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用 0.9 0.1 0.1就要比用1 0 0要好。但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。MATLAB归一化方法你在所有的数据中找出最大的那个数max可以用matlab的max函数在所有的数据中找出最小的那个数min可以用 matlab的min函数如果是Origin,那么选中要归一化的数据列,点击右键,在弹出的对话框中选择 Normali

9、zeMOrigjnPro 8.6 2-bit C:UscrsAdmtnistratorSDcPictk TITLED ”File Edit Vi-w PIqI ColunninWqf kahectArialyibi?JtPl 4 lirii 融亡1 匙崗iy (tun eo别Ctn-AJt + Low Help as晶Book!Copy (indudmi label rows)P*stiFCtri+VillInsertCtearDeleteRefriove LinkFiM Colum n withSort CoHkimnSort Wc rk.hoM3tNormali7.f rqmeH-cy C

10、cuni,BStatistics: on Columns.Column Width-.H在excel表格中如何对数据进行归一化处理比如对A1到A10中的是个数进行归一化处理,就是分别计算每个数占这是个数这和的百分比,可以用公式计算,不是很难,例如:在单元格B1中输入“ =A1/sum($A$1:$A$10),点击B1右下角的黑十字下拉到B10放开鼠标,b列的结果就是你要的归一化结果。数据多的话只需改动公式中sum函数的引用位置,女口 A列有100个数,B1中改为” =A1/sum($A$1 : $A$100)“四.利用SPSS检验是否符合正态分布正态分布也叫常态分布,在我们后面说的很多东西都需

11、要数据呈正态分布。下面的图就是正态分布曲 线,中间隆起,对称向两边下降。IH下面我们来看一组数据,并检验期初平均分”数据是否呈正态分布(此数据已在SPSS里输入好)SUS UbiI n EdlilthrXff?) Ml鼻El,界 R1 ft.卢执歸 H-r (Bfl ;: X* 皿 131 甲目加tflaiaiglmi-rirlGiiin 寻剛gjr猪迂 眾初尹也I亢町理(立玄毘叵(JtfW 劳 N (Mff Ji2i的K S&9 43030 00aoogj sramS3 00F7T14a26T2i1311寸211111忑21 寸211111It21Jt1*JtIt113t12t131!1!I

12、T1曲31211112t121JT13iJT1吃临4h*t悴內間底范馬宵呼宀离空龔*丁卓艸职赤tit14趙也丈哨哺JL店直唁*:.+ 伟駆趙11丹坤X蛊僅黄! yw卯注产塔博於QBIdQC36 5釦QQ旳meiw6HOD69 00*3幹E5L 5HM1QQQQ用OCJ41 00郴iI0U林GO的血(3 0CK09000的co門0JeauorzoHOD01 006BIB田m&I5E30D田00BEnoc71.CD因QDS CDauxSDJnm7B0DS3. CDa.oDii.5曲00Sl.ODKODai onrajwoo75 OD60 00filOOSODaimE9 0DraoouwS&Q&9

13、DO7S0QoaKI 0035Dssoo3 00程OH祀S7700啊0DDOO0015 0E0069 00woaROD&I.09400fSODnoa會0mjoottOO财co游00j冲MOO 0和0043 00mooeaooJOW6550 tnm4D06?J3DOOffi00P? w乂 5JO 00ODso. tn6S.DD50-D30.00甜ODa rae i on6QJ&nea oa72 ODS6DiOOOHOD也gE3 001 5带to阳OQ59.DGQ_XJXm-4xrfxuo-wBO-JJflotflBlf弓韦于占一/一 首专 硼4勺劭 0 .ATiFasm旳码严-070刑乃幵丄7l-iJeJkFIrof出?.经軾生10此图*?203 0U 0 m54510 5-1吕亍15 013545体045552530516 5忑0535 0 亠吕 415-2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号