文档详情

单片机及嵌入式c语言代码优化

ldj****22
实名认证
店铺
DOC
66.50KB
约18页
文档ID:41309222
单片机及嵌入式c语言代码优化_第1页
1/18

单片机及嵌入式 C 语言代码优化 目录目录__ 2 C 代码优化方案__ 4 1、选择合适的算法和数据结构__ 4 2、使用尽量小的数据类型__ 5 3、减少运算的强度__ 5 (1) 、查表(游戏程序员必修课)_ 5 (2) 、求余运算__ 6 (3) 、平方运算__ 6 (4) 、用移位实现乘除法运算__ 6 (5) 、避免不必要的整数除法__ 8 (6) 、使用增量和减量操作符__ 8 (7) 、使用复合赋值表达式__ 8 (8) 、提取公共的子表达式__ 9 4、结构体成员的布局__ 9 (1)按数据类型的长度排序__ 10 (2)把结构体填充成最长类型长度的整倍数__ 10 (3)按数据类型的长度排序本地变量__ 10 (4)把频繁使用的指针型参数拷贝到本地变量__ 11 5、循环优化__ 12 (1) 、充分分解小的循环__ 12 (2) 、提取公共部分__ 13 (3) 、延时函数__ 13 (4) 、while 循环和 do…while 循环__ 14 (6) 、循环展开__ 14 (6) 、循环嵌套__ 15 (7) 、Switch 语句中根据发生频率来进行 case 排序__ 16 (8) 、将大的 switch 语句转为嵌套 switch 语句__ 17 (9) 、循环转置__ 18 (10) 、公用代码块__ 19 (11)提升循环的性能__ 19 (12) 、选择好的无限循环__ 20 6、提高 CPU 的并行性__ 21 (1)使用并行代码__ 21 (2)避免没有必要的读写依赖__ 22 7、循环不变计算__ 23 8、函数__ 24 (1)Inline 函数__ 24 (2)不定义不使用的返回值__ 24 (3)减少函数调用参数__ 24 (4)所有函数都应该有原型定义__ 24 (5)尽可能使用常量(const)_ 25 (6)把本地函数声明为静态的(static)_ 25 9、采用递归__ 25 10、变量__ 25 (1)register 变量__ 25 (2) 、同时声明多个变量优于单独声明变量__ 26 (3) 、短变量名优于长变量名,应尽量使变量名短一点__ 26 (4) 、在循环开始前声明变量__ 26 11、使用嵌套的 if 结构__ 261、选择合适的算法和数据结构 选择一种合适的数据结构很重要,如果在一堆随机存放的数中使用了大量的插 入和删除指令,那使用链表要快得多。

数组与指针语句具有十分密切的关系, 一般来说,指针比较灵活简洁,而数组则比较直观,容易理解对于大部分的 编译器,使用指针比使用数组生成的代码更短,执行效率更高 在许多种情况下,可以用指针运算代替数组索引,这样做常常能产生又快又短 的代码与数组索引相比,指针一般能使代码速度更快,占用空间更少使用 多维数组时差异更明显下面的代码作用是相同的,但是效率不一样 数组索引指针运算For(;;){ p=array A=array[t++]; for(;;){ a=*(p++); } } 指针方法的优点是,array 的地址每次装入地址 p 后,在每次循环中只需对 p 增 量操作在数组索引方法中,每次循环中都必须根据 t 值求数组下标的复杂运 算 2、使用尽量小的数据类型 能够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用 整型变量定义的变量就不要用长整型(long int),能不使用浮点型(float)变量就不 要使用浮点型变量当然,在定义变量后不要超过变量的作用范围,如果超过 变量的范围赋值,C 编译器并不报错,但程序运行结果却错了,而且这样的错 误很难发现。

在 ICCAVR 中,可以在 Options 中设定使用 printf 参数,尽量使用基本型参数 (%c、%d、%x、%X、%u 和%s 格式说明符),少用长整型参数(%ld、%lu、%lx 和%lX 格式说明符),至于浮点型的参数(%f)则尽量不要使用,其它 C 编译器也 一样在其它条件不变的情况下,使用%f 参数,会使生成的代码的数量增加很 多,执行速度降低 3、减少运算的强度 (1) 、查表(游戏程序员必修课) 一个聪明的游戏大虾,基本上不会在自己的主循环里搞什么运算工作,绝对是 先计算好了,再到循环里查表看下面的例子: 旧代码: long factorial(int i) { if (i == 0) return 1; else return i * factorial(i - 1); } 新代码: static long factorial_table[] = {1, 1, 2, 6, 24, 120, 720 /* etc */ }; long factorial(int i) { return factorial_table; } 如果表很大,不好写,就写一个 init 函数,在循环外临时生成表格。

(2) 、求余运算a=a%8; 可以改为: a=a 说明:位操作只需一个指令周期即可完成,而大部分的 C 编译器的“%”运算均 是调用子程序来完成,代码长、执行速度慢通常,只要求是求 2n 方的余数, 均可使用位操作的方法来代替 (3) 、平方运算a=pow(a, 2.0); 可以改为: a=a*a; 说明:在有内置硬件乘法器的单片机中(如 51 系列),乘法运算比求平方运算快 得多,因为浮点数的求平方是通过调用子程序来实现的,在自带硬件乘法器的 AVR 单片机中,如 ATMega163 中,乘法运算只需 2 个时钟周期就可以完成 既使是在没有内置硬件乘法器的 AVR 单片机中,乘法运算的子程序比平方运 算的子程序代码短,执行速度快 如果是求 3 次方,如: a=pow(a,30); 更改为: a=a*a*a; 则效率的改善更明显 (4) 、用移位实现乘除法运算a=a*4; b=b/4; 可以改为: a=a>2; 通常如果需要乘以或除以 2n,都可以用移位的方法代替在 ICCAVR 中,如果 乘以 2n,都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘 除法子程序。

用移位的方法得到代码比调用乘除法子程序生成的代码效率高实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果,如: a=a*9 可以改为: a=(a 0) { while (*q > (*r = a / *q)) { *q = (*q + *r) >> 1; } } *r = a - *q * *q; } 推荐的代码: // 假设 q != r void isqrt(unsigned long a, unsigned long* q, unsigned long* r) { unsigned long , rr; = a; if (a > 0) { while ( > (rr = a / )) { = ( + rr) >> 1; } } rr = a - * ; *q = ; *r = rr; } 5、循环优化 (1) 、充分分解小的循环要充分利用 CPU 的指令缓存,就要充分分解小的循环特别是当循环体本 身很小的时候,分解循环可以提高性能注意:很多编译器并不能自动分解循环不好的代码: // 3D 转化:把矢量 V 和 4x4 矩阵 M 相乘 for (i = 0; i 0;i--) ; } 两个函数的延时效果相似,但几乎所有的 C 编译对后一种函数生成的代码均比 前一种代码少 1~3 个字节,因为几乎所有的 MCU 均有为 0 转移的指令,采用 后一种方式能够生成这类指令。

在使用 while 循环时也一样,使用自减指令控 制循环会比使用自加指令控制循环生成的代码更少 1~3 个字母但是在循环中 有通过循环变量“i”读写数组的指令时,使用预减循环有可能使数组超界,要引 起注意 (4) 、while 循环和 do…while 循环 用 while 循环时有以下两种循环形式: unsigned int i; i=0; while (i0); 在这两种循环中,使用 do…while 循环编译后生成的代码的长度短于 while 循环5) 、循环展开 这是经典的速度优化,但许多编译程序(如 gcc -funroll-loops)能自动完成这个事, 所以现在你自己来优化这个显得效果不明显 旧代码: for (i = 0; i type) { case FREQUENT_MSG1: handleFrequentMsg(); break; case FREQUENT_MSG2: handleFrequentMsg2(); break; case FREQUENT_MSGn: handleFrequentMsgn(); break; default: //嵌套部分用来处理不经常发生的消息switch (pMsg->type) { case INFREQUENT_MSG1: handleInfrequentMsg1(); break; case INFREQUENT_MSG2: handleInfrequentMsg2(); break; 。

case INFREQUENT_MSGm: handleInfrequentMsgm(); break; } } 如果 switch 中每一种情况下都有很多的工作要做,那么把整个 switch 语句用一 个指向函数指针的表来替换会更加有效,比如下面的 switch 语句,有三种情况:enum MsgType{Msg1, Msg2, Msg3} switch (ReceiveMessage() { case Msg1; case Msg2; case Msg3; } 为了提高执行速度,用下面这段代码来替换这个上面的 switch 语句/*准备工作*/ int handleMsg1(void); int handleMsg2(void); int handleMsg3(void); /*创建一个函数指针数组*/ int (*MsgFunction [])()={handleMsg1, handleMsg2, handleMsg3}; /*用下面这行更有效的代码来替换 switch 语句*/ status=MsgFunction[ReceiveMessage()](); (9) 、循环转置 有些机器对 JNZ(为 0 转移)有特别的指令处理,速度非常快,如果你的循环对 方向不敏感,可以由大向小循环。

旧代码: for (i = 1; i b->c[4]->aardvark +a->b->c[4]->baboon +a->b->c[4]->cheetah +a->b->c[4]->dog; 新代码:struct animals * temp = a->b->c[4];total =temp->aardvark +temp->baboon +temp->cheetah +temp->dog; 一些老的 C 语言编译器不做聚合优化,而符合 ANSI 规范的新的编译器可以自 动完成这个优化,看例子:float a,b,c,d,f,g;a = b / c * d;f = b * g / c; 这种写法当然要得,但是没有优化float a,b,c,d,f,g;a = b / c * d;f = b / c * g; 如果这么写的话,一个符合 ANSI。

下载提示
相似文档
正为您匹配相似的精品文档