数据分析幻灯片

上传人:爱****1 文档编号:927760 上传时间:2017-05-22 格式:PPT 页数:65 大小:420KB
返回 下载 相关 举报
数据分析幻灯片_第1页
第1页 / 共65页
数据分析幻灯片_第2页
第2页 / 共65页
数据分析幻灯片_第3页
第3页 / 共65页
数据分析幻灯片_第4页
第4页 / 共65页
数据分析幻灯片_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《数据分析幻灯片》由会员分享,可在线阅读,更多相关《数据分析幻灯片(65页珍藏版)》请在金锄头文库上搜索。

1、第六章 数据分析,制作: 陈学明,关系运算,MATLAB提供了6种关系运算符:(小于)、(大于)、=(大于或等于)、=(等于)、=(不等于)。它们的含义不难理解,但要注意其书写方法与数学中的不等式符号不尽相同。,关系运算符的运算法则,当两个比较量是标量时,直接比较两数的大小。若关系成立,关系表达式结果为1,否则为0。 当参与比较的量是两个维数相同的矩阵时,比较是对两矩阵相同位置的元素按标量关系运算规则逐个进行,并给出元素比较结果。最终的关系运算的结果是一个维数与原矩阵相同的矩阵,它的元素由0或1组成。,关系运算符的运算法则,(3) 当参与比较的一个是标量,而另一个是矩阵时,则把标量与矩阵的每一

2、个元素按标量关系运算规则逐个比较,并给出元素比较结果。最终的关系运算的结果是一个维数与原矩阵相同的矩阵,它的元素由0或1组成。,逻辑运算,MATLAB提供3种逻辑运算符:&(与)、|(或)和(非)。逻辑运算的运算法则为: (1) 在逻辑运算中,确认非零元素为真,用1表示,零元素为假,用0表示。 (2) 设参与逻辑运算的是两个标量a和b,那么, a&b a,b全为非零时,运算结果为1,否则为0。 a|b a,b中只要有一个非零,运算结果为1。 a 当a是零时,运算结果为1;当a非零时,运算结果为0。,逻辑运算,(3) 若参与逻辑运算的是两个同维矩阵,那么运算将对矩阵相同位置上的元素按标量规则逐个

3、进行。最终运算结果是一个与原矩阵同维的矩阵,其元素由1或0组成。(4) 若参与逻辑运算的一个是标量,一个是矩阵,那么运算将在标量与矩阵中的每个元素之间按标量规则逐个进行。最终运算结果是一个与矩阵同维的矩阵,其元素由1或0组成。,逻辑运算,(5) 逻辑非是单目运算符,也服从矩阵运算规则。(6) 在算术、关系、逻辑运算中,算术运算优先级最高,逻辑运算优先级最低。,多项式及运算,多项式的 MATLAB表示法: 如:PS32S23S4 MATLAB可表示为系数向量 P1 2 3 4,多项式的生成,直接输入系数向量 p=1 2 3 4PS32S23S4*求多项式的根,可用函数roots(P)【例】 rr

4、oots(P) ans-1.6506 -0.1747+1.5469i -0.1747-1.5469i,若已知多项式根向量,可用poly(P)生成多项式【例】 已知 P1(s)(s+1)(s+2)(s+3)的 根为: -1 -2 -3 则编写:P1poly(-1,-2,-3) 运行后,得 P1 1 6 11 6 表示已生成多项式为:P=s3+6s2+11s+6,多项式的生成,多项式运算,1求多项式值 polyval(p,x0) V=polyval(P1,1) V=242多项式加、减: * 阶次相同,低阶缺项系数必须补0【例】: (s2+2s+1)+ 2s2 P1= 1 2 1; P2= 2 0

5、0; P=P1+P2 P = 3 2 1,多项式运算,3多项式乘法 conv.(卷积) (s+1)(s3+6s2+11s+6) P1=1 1; P2=1 6 11 6; P3=conv(P1,P2) P3= 1 7 17 17 6 P3=s4+7s3+17s2+17s+6,多项式运算,4多项式除运算deconva=1 2 3; c = 4 13 28 27 18d=deconv(c,a) c = 4 13 28 27 18,多项式运算,5部分分式展开式residue r,p,k=residue(b,a) b(s) r(1) r(2) r(n) - = - + - + . + - + k(s)

6、a(s) s - p(1) s - p(2) s - p(n) p=p(1), p(2),p(n) r=r(1),r)2),.r(n). k(s) 直接项,多项式运算,6多项式微分运算polyder【例】 f(x)=2x5+5x4+4x2+x+4 p=2 5 0 4 1 4; h=polyder(p) h = 10 20 0 8 1,练习,例: x1+2x2=8 2x1+3x2=13,=,方程ax=b,a=1 2;2 3;b=8;13;x=inv(a)*b x=ab x = x = 2.00 2.00 3.00 3.00,多项式拟合与插值,在分析试验数据中,常常要面临将试验数据作解析描述的任务

7、,这个问题有曲线拟合和插值两种方法。在曲线拟合中,假定已知曲线的规律,作曲线的最佳逼近,但不需要经过所有的数据点;在插值中,认为数据是准确的,求取其中描述点之间的数据。,多项式拟合,多项式的最小二乘曲线拟合使用polyfit,它需要曲线的x、y值,以及曲线的阶数。曲线的阶数:如果曲线的阶数选择的过小,拟合效果不好;如果曲线的阶数过高,虽然数据点上看到效果好,数据点之间会出现有数据振荡的问题,阶数不宜过高,一般小于5阶。灵活使用拟合,插值,插值函数,1、曲线插值函数interp1方法 t=interp1(x,y,x0,method)x、y:原始数据点,x0为进行插值的数组,method为插值算法

8、:线性插值(linear),三次样条插值(spline),三次多项式插值(cubic).如果x0出界,则对应值为NaN,三次样条插值,对于给定的离散的测量数据x,y(称为断点),要寻找一个三项多项式y = p(x),以逼近每对数据(x,y)点间的曲线。过两点(xi, yi)和(xi+1, yi+1)只能确定一条直线,而通过一点的三次多项式曲线有无穷多条。为使通过中间断点的三次多项式曲线具有唯一性,要增加两个条件(因为三次多项式有4 个系数):1三次多项式在点(xi, yi)处有: pi (xi) = pi (xi);2三次多项式在点(xi+1, yi+1)处有: pi (xi+1) = pi

9、(xi+1);3p(x)在点(xi, yi)处的斜率是连续的(为了使三次多项式具有良好的解析性,加上的条件);4p(x)在点(xi, yi)处的曲率是连续的;,曲面(二维)插值,插值函数: interp2,基本形式:zi=interp2(x,y,z,xi,yi,method)method包括 linear:线性 cubic:三次多项式 nearest:粗略估计数据,集中趋势的测定,在统计研究中,需要搜集大量数据并对其进行加工整理,对这些数据进行整理之后发现:大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一

10、种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,是现象规律性的数量表现。,数据特征,设 是取自总体X的一个简单随机样本,在n次抽样以后得到样本的一组观测值 我们通过对数据的分析研究可以得到总体X的有关信息,在MATLAB中有专门的函数分析数据特征,如下表所示.,集中趋势的描述,1均值函数(1)算术平均数(2)调和平均数数值倒数的平均数的倒数。 (3)几何平均数n个观察值连乘积的n次方根 。,集中趋势的描述,2中位数(中位次数)函数 中位数是指全体数值按大小排列后位于中间的数值。 如果参数集合中包含有偶数个数字,中位数函数将返回位于中间的两个数的平均值。,集中趋势的描述,3众数函数 众

11、数是一组数列中出现次数最多的数值,众数函数返回某一数组或数据区域中出现频率最多的数值。4最大(小)值函数 最大(小)值函数可以返回数据集中的最大(小)数值。,三种平均数的特点,众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不惟一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量。均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。,表示变异程度的统计量,标准差:它是各个数据与均

12、值偏离程度的度量.方差:标准差的平方.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定 。极差:样本中最大值与最小值之差.,四分位数,四分位数是将中值的前后两部分数值再等分为二,以数值小的一端算起,前半部的分区点称为第1四分位数,后半部的分区点称为第3四分位数,而中值即为第2四分位数。四分位数通常用于在销售额和测量值数据集中对总体进行分组。,数据特征示例一,例4. 已知数据:a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 60

13、8 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;计算该数据特征.,数据特征示例二,已知数据:1,1,1,1,1,1,100;计算其数据特征,由此你有何发现?计算结果为:y= 15.143 1 1.9307 1.1647 1 99 1400.1 37.418 0 24.245如果本例的数据全部为1,则各种平均值都应等于1,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是稳健的.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 教育/培训/课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号