第6章汇编语言程序设计DSP技术与应用实例第3版课件

PPT
  • 阅读 45 次
  • 下载 0 次
  • 页数 36 页
  • 大小 229.916 KB
  • 2022-11-24 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档25.00 元 加入VIP免费下载
此文档由【小橙橙】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
第6章汇编语言程序设计DSP技术与应用实例第3版课件
可在后台配置第一页与第二页中间广告代码
第6章汇编语言程序设计DSP技术与应用实例第3版课件
可在后台配置第二页与第三页中间广告代码
第6章汇编语言程序设计DSP技术与应用实例第3版课件
可在后台配置第三页与第四页中间广告代码
第6章汇编语言程序设计DSP技术与应用实例第3版课件
第6章汇编语言程序设计DSP技术与应用实例第3版课件
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 36
  • 收藏
  • 违规举报
  • © 版权认领
下载文档25.00 元 加入VIP免费下载
文本内容

【文档说明】第6章汇编语言程序设计DSP技术与应用实例第3版课件.ppt,共(36)页,229.916 KB,由小橙橙上传

转载请保留链接:https://www.ichengzhen.cn/view-44760.html

以下为本文档部分文字说明:

第6章汇编语言程序设计DSP技术与应用实例第3版1.条件算符条件分支转移指令或条件调用、条件返回指令都用条件来限制分支的转移、调用和返回操作。条件算符分成两组,每组组内还有分类。第1组:EQNEQLEQGEQLTGTOVNOV第2组:TCNTCCNCBIONBIO选用条件算符

时应当注意以下3点:•第1组:组内两类条件可以进行与/或运算,但不能在组内同一类中选择两个条件算符与/或。当选择两个条件时,累加器必须是同一个。例如,可以同时选择AGT和AOV,但不能同时选择AGT和BOV。

•第2组:可从组内3类算符中各选一个条件算符与/或,但不能在组内同一类中选两个条件算符与/或。例如,可以同时测试TC、C和BIO,但不能同时测试NTC和TC。•组与组之间的条件只能进行或运算。2.循环操作BANZ在程序设计时,经常需要重复执行某段程序,利用BANZ(当辅助寄

存器不为0时转移)指令执行循环计数和操作是十分方便的。SUM:STM#x,AR3STM#4,AR2loop:ADD*AR3+,A;程序存储器BANZloop,*AR2-STLA,y3.比较操作CMPR编程时,经常需要数据与数据进行比较,这时利用比较指令CMPR是很合适的。CMPR指令测试所规定的

AR寄存器(AR1~AR7)与AR0的比较结果。如果所给定的测试条件成立,则TC位置1,然后,条件分支转移指令就可根据TC位的状态进行分支转移了。注意,所有比较的数据都是无符号操作数。STM#5,AR1STM#10,A

R0loop:......*AR1+......CMPRLT,AR1BCloop,TC6.2堆栈的使用方法TMS320C54x提供一个用16位堆栈指针(SP)寻址的软件堆栈。当向堆栈中压入数据时,堆栈从高地址向低地址增长。堆栈指针是减在前、加在后,即先SP1再压入数据,先弹出数

据后SP+1。如果程序中要用到堆栈,则必须先进行设置,方法如下:size.set100stack.usect"STK",sizeSTM#stack+size,SP上述语句在数据RAM空间开辟一个堆栈区。前两句在数据RAM中自定义一个名为STK的

保留空间,共100个单元。第3句将这个保留空间的高地址(#stack+size)赋给SP,作为栈底,参见图6-1。至于自定义未初始化段STK究竟定位在数据RAM中的什么位置,应当在链接器命令文件中规定。数据存储器0STK堆栈的设置size.set100stack.usec

t"STK",sizeSTM#stack+size,SP堆栈的用法压入操作:SP先减1后,再将数据压入堆栈中弹出操作:数据弹出后,再将SP加1…stack可用栈区SP→最后用的单元已用栈区65535…图6

-1堆栈设置堆栈之后,就可以使用堆栈了,例如:CALLpmad;(SP)-1→SP,(PC)+2→TOS;pmad→PCRET;(TOS)→PC,(SP)+l→SP堆栈区应开辟多大?这需要按照以下步骤来确定:①先开辟一个大堆栈区,且用已知数填充。②运行程序,执行所有的操

作。③暂停,检查堆栈中的数值如下图。④用过的堆栈区才是实际需要的堆栈空间。1.加减法【例6-4】计算z=x+yw。SUMB:LDx,AADDy,ASUBw,ASTLA,zRET.end计算结果:数据寄存器地址存储内容十进制数x0060H000AH

10y0061H001AH26w0062H0017H23z0063H000DH136.3加减法运算和乘法运算2.乘法【例6-5】计算y=mx+b。SU:LDm,TMPYx,AADDb,ASTLA,yRET.end计

算结果:数据寄存器地址存储内容十进制数m0060H0003H3x0061H000FH15b0062H0014H20y0063H0041H656.4重复操作1.重复执行单条指令重复指令RPT或RPTZ允许重复执行紧随其后的那一条指令。如果要重复执行n次,则重复指令

中应规定计数值为n1。由于重复的指令只需要取指一次,与利用BANZ指令进行循环相比,效率要高得多。【例6-9】对数组x[5]={0,0,0,0,0}进行初始化。.bssx,5或者STM#x,AR1LD#0

H,ARPT#4STLA,*AR1+或者.bssx,5STM#x,AR1RPTZ#4STLA,*AR1+2.块程序重复操作块程序重复操作RPTB将重复操作的范围扩大到任意长度的循环回路。由于块程序重复指令RPTB的操作数是循环回路的结束地址,而且,

其下条指令就是重复操作的内容,因此必须先用STM指令将所规定的迭代次数加载到块重复计数器(BRC)中。RPTB指令的特点是:对任意长度的程序段的循环开销为0,其本身是一条2字4周期指令;循环开始地址(RSA)是RPTB指令的下一行,结束地址(REA)由RPTB指令的操作数规定。【例6-10】对数

组x[5]中的每个元素加1。.bssx,5start:LD#1,16,BSTM#4,BRCSTM#x,AR4RPTBnext-1ADD*AR4,16,B,ASTHA,*AR4+next:LD#0,B3.循环的嵌套2nd:1st:STM#L1,AR7;2T外部STM#M1,BRC

;2TRPTB2nd1;4T中间中间RPT#N1;1T内部中间中间外部外部BANZ1st,*AR7;4T312执行RPT指令时要用到RPTC寄存器(重复计数器),执行RPTB指令时要用到BRC、RSA和RSE寄存器。由于两者用了不

同的寄存器,因此RPT指令可以嵌套在RPTB指令中,实现循环的嵌套。当然,只要保存好有关的寄存器,RPTB指令也可以嵌套在另一条RPTB指令中,但效率并不高。下图是一个三重循环嵌套结构,内层、中层和外层三重循环分别采用RPT、RPTB和BANZ

指令,重复执行N、M和L次。6.5数据块传送这些指令的特点如下:(1)传送速度比加载和存储指令的速度要快;(2)传送数据不需要通过累加;(3)可以寻址程序存储器;(4)与RPT指令相结合,可以实现数据块传送。数据存储器←→数据存储器#W/C数据存储器←→MMR#W/

CMVDKSmem,dmadMVKDdmad,SmemMVDDXmem,Ymem2/22/21/1MVDMdmad,MMRMVMDMMR,dmadMVMMmmr,mmr2/22/21/1程序存储器←→数据存储器#W/C程序存储器(Acc)←

→数据存储器#W/CMVPDPmad,SmemMVDPSmem,Pmad2/32/4READASmemWRITASmem1/51/51.程序存储器→数据存储器【例6-11】初始化数组x[5]={1,2,3,

4,5}。.title"zh9.asm".mmregsSTACK.usect"STACK",10H.bssx,5.datatable:.word1,2,3,4,5.defstart.textstart:STM#x,AR1

RPT#4MVPDtable,*AR1+end:Bend.end2.数据存储器→数据存储器【例6-12】编写一段程序,将数据存储器中数组x[20]中的数据复制到数组y[20]中。.title"zh10.asm".

mmregsSTACK.usect"STACK",30H.bssx,20.bssy,20.datatable:.word1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20.defstart.textstart:STM#x,AR1RPT#

19MVPDtable,*AR1+;从程序存储器传送到数据存储器中STM#x,AR2STM#y,AR3RPT#19MVDD*AR2+,*AR3+;从数据存储器传送到数据存储器中end:Bend.end20个数据从0060H~0073H传送到0074H~008

7H,结果如图所示:6.6双操作数乘法TMS320C54x片内的多总线结构,允许在一个机器周期内通过两条16位数据总线(C总线和D总线)寻址两个数据和系数,如图6-6所示。数据存储器乘法器/加法器累加器A累加器BC总线D总线图6-6双操作数乘法如果求y

=mx+b,则单操作数和双操作数实现方法比较如表6-4所示:表6-4单/双操作数编程比较用双操作数指令编程的特点为:(1)用间接寻址方式获得操作数,且辅助寄存器只能用AR2~AR5;(2)占用的程序空间小;(3)运行的速度快。单操作数方法双操作数方法LDm,TMPYx,AADDb,ASTLA,y

MPY*AR2,*AR3,AADDb,ASTLA,y双操作数MAC型的指令有4种,如表6-5所示:表6-5MAC型双操作数指令对于Xmem和Ymem,只能用以下辅助寄存器及寻址方式:辅助寄存器AR2寻址方式*ARnAR3*ARn+AR4*ARnAR5*A

Rn+0%指令功能MPYXmem,Ymem,dstMACXmem,Ymem,src[,dst]MASXmem,Ymem,src[,dst]MACPSmem,Pmad,src[,dst]dst=Xmem*Ymemdst=src+Xmem*Ymemdst=src-Xme

m*Ymemdst=src+Smem*Pmad6.7长字运算和并行运算1.长字指令DLDLmem,dst;dst=LmemDSTsrc,Lmem;Lmem=srcDADDLmem,src[,dst];dst=src+LmemDSUBLmem,src[,dst];

dst=src-LmemDRSUBLmem,src[,dst];dst=Lmem-src(1)偶地址排列法(2)奇地址排列法数据存储器偶地址:xhi奇地址:xlo程序存储器偶地址:1234奇地址:5678.long12345678h变

量名称字长页邻接偶地址排列法.bssxhi,2,1,1图6-8奇偶地址排列规定【例6-15】计算Z32=X32+Y32。标准运算.title"zh16.asm".mmregsSTACK.usect"STACK",10H.bssxhi,1.bss

xlo,1.bssyhi,1.bssylo,1.bsszhi,1.bsszlo,1.defstart.datatable:.word1678H,2345H.word1020H,0D34AH.textstart:STM#0,SWWSRSTM#S

TACK+10H,SPSTM#xhi,AR1RPT#3MVPDtable,*AR1+LDxhi,16,AADDSxlo,AADDyhi,16,AADDSylo,ASTHA,zhiSTLA,zloend:Bend.end(6个字,6个T)长字运算.title"zh17.asm".mm

regsSTACK.usect"STACK",10H.bssxhi,2,1,1.bssyhi,2,1,1.bsszhi,2,1,1.defstart.datatable:.long16782345H,1020D34AH.textstar

t:STM#0,SWWSRSTM#STACK+10H,SPSTM#xhi,AR1RPT#3MVPDtable,*AR1+DLDxhi,ADADDyhi,ADSTA,zhiend:Bend.end(3个字,3个T)2.并行运算并行运算指令举例指令举例操

作说明LD||MAC[R]LD||MAS[R]LDXmem,dst||MAC[R]Ymem[,dst2]dst=Xmem<<16dst2=dst2+T*YmemST||LDSTsrc,Ymem||LDXmem,dstYmem=src>>(16-ASM)d

st=Xmem<<16ST||MPYST||MAC[R]ST||MAS[R]STsrc,Ymem||MAC[R]Xmem,dstYmem=src>>(16-ASM)dst=dst+T*XmemST||ADDS

T||SUBSTsrc,Ymem||ADDXmem,dstYmem=src>>(16-ASM)dst=dst+Xmem【例6-16】用并行运算指令编写计算z=x+y和f=e+d的程序。.mmregsSTACK.usect"STACK",10H.bssx,3

.bssd,3.defstart.datatable:.word0123H,1027H,0,1020H,0345H,0.textstart:STM#0,SWWSRSTM#STACK+10H,SPSTM#x,A

R1RPT#5MVPDtable,*AR1+STM#x,AR5STM#d,AR2LD#0,ASMLD*AR5+,16,AADD*AR5+,16,ASTA,*AR5;并行指令||LD*AR2+,BADD*AR2+,1

6,BSTHB,*AR2end:Bend.end3.64位加法和减法运算64位数的加法和减法算式如下:w3w2w1w0(W64)+x3x2Cx1x0(X64)低32位相加产生进位C-y3y2C'y1y0(Y64)低32位相减产生借位C'z3z2z1z0(Z64)〖例6-

17〗编写计算Z64=W64+X64-Y64的程序。W、X、Y和结果Z都是64位数,它们都由两个32位的长字组成。利用长字指令可以完成64位数的加/减法。DLDw1,A;A=w1w0DADDx1,A;A

=w1w0+x1x0,产生进位CDLDw3,B;B=w3w2ADDCx2,B;B=w3w2+x2+CADDx3,16,B;B=w3w2+x3x2+CDSUBy1,A;A=w1w0+x1x0-y1y0,产生借位C'DSTA,z1;z

1z0=w1w0+x1x0-y1y0SUBBy2,B;B=w3w2+x3x2+C-y2-C'SUBy3,16,B;B=w3w2+x3x2+C-y3y2-C'DSTB,z3;z3z2=w3w2+x3x2+C-y3y2-C'数据计算结果4.32位乘

法运算32位乘法算式如下:x1x0SU×y1y0SUx0×y0U×Uy1×x0S×Ux1×y0S×Uy1×x1S×Sw3w2w1w0SUUU其中,S——带符号数,U——无符号数。由上算式可见,在32位乘法运算中,实际上包括三种乘法运算:U×U,S×

U及S×S。一般的乘法运算指令都是两个带符号数相乘,即S×S。所以,在编程时,还要用到以下两条乘法指令:MACSUXmem,Ymem,src;无符号数与带符号数相乘并累加;src=U(Xmem)×S(Ymem)+srcMPYUSmem,d

st;无符号数相乘;dst=U(T)×U(Smem)〖例6-18〗编写计算W64=X32×Y32的程序。32位乘法实现的64位乘积的程序如下:STM#x,AR2STM#y,AR3LD*AR2,T;T=x0MPYU*AR3+,A;A=

ux0×uy0STLA,w0;w0=ux0×uy0LDA,-16,A;A=A>>16MACSU*AR2+,*AR3-,A;A+=y1×ux0MACSU*AR3+,*AR2,A;A+=x1×uy0STLA,w1;w1=ALDA,-16,A;A=A>>16MAC*AR3,*AR2

,A;A+=x1×y1STLA,w2;w2=A的低16位STHA,w3;w3=A的高16位6.8小数运算1.小数的表示方法TMS320C54x采用2的补码表示小数,其最高位为符号位,数值范围为1~+1。一个16位的2的补码小数(Q15格式)的每一位的权值为:MSBLSB-1.2-12-22-3„

2-15一个十进制小数乘以32768之后,再将其十进制整数部分转换成十六进制数,就能得到这个十进制小数的2的补码表示,例如:≈17FFFH0.5正数:乘以327684000H00000H-0.5负数:其绝对值部分乘以32768,再取反加1C000H-18000H在汇编语言

程序中,是不能直接写入十进制小数的。若要定义一个系数0.707,可以写成:.word32768*707/1000,不能写成32768*0.707。2.小数乘法与冗余符号位0100(0.5)×1101(-0.375)01000000010011

00(-0100)1110100(-0.1875)一个小数乘法的例子(假设字长4位,累加器8位):上述乘积是7位,当将其送到累加器时,为保持乘积的符号,必须进行符号位扩展,这样,累加器中的值为11110100(-0

.09375),出现了冗余符号位。原因是:Sxxx(Q3格式)×Syyy(Q3格式)SSzzzzzz(Q6格式)即两个带符号数相乘,得到的乘积带有2个符号位,造成错误的结果。解决冗余符号位的办法:在程序中设定状态寄存器ST1中的FRCT(小数方式)位为1,在乘法器将结果传送至累加器时就能自动地左

移1位,累加器中的结果为:Szzzzzz0(Q7格式),即11101000(0.1875),自动地消去了两个带符号数相乘时产生的冗余符号位。在小数乘法编程时,应当事先设置FRCT位如下:SSBXFRCTMPY*AR2,*AR3,ASTHA

,@Z这样,TMS320C54x就完成了Q15×Ql5=Q15的小数乘法。6.9除法运算1.被除数的绝对值小于除数的绝对值,商为小数在一般的DSP中都没有除法器硬件。因为除法器硬件代价很高,所以就没有专门的

除法指令。同样,在TMS320C54x中也没有一条单周期的16位除法指令。但是,利用条件减法指令(SUBC指令),加上重复指令“RPT#15”,就可实现两个无符号数的除法运算。条件减法指令的功能如下:SUBCSmem,src2.被除数的绝

对值大于等于除数的绝对值,商为整数6.10浮点运算1.浮点数的表示方法在TMS320C54x中,浮点数由尾数和指数两部分组成,它与定点数的关系如下:定点数=尾数×2(指数)例如,定点数0x2000(

0.25)用浮点数表示时,尾数为0x4000(0.5),指数为1,即0.25=0.5×21浮点数的尾数和指数可正可负,均用补码表示。指数的范围为8~31。2.定点数到浮点数的转换TMS320C54x通过3

条指令可将一个定点数转化成浮点数:(1)EXPA(2)STT,EXPONENT(3)NORMA3.浮点数到定点数的转换知道TMS320C54x浮点数的定义后,就不难将浮点数转换成定点数了。因为浮点数的指数就是在规格化时左移(指数为负时是右移)的位数,所以在将浮点数转换成定点数时,只要按指

数值将尾数右移(指数为负时是左移)就行了。4.浮点乘法举例【例6-26】编写浮点乘法程序,完成x1×x2=0.3×(0.8)运算。程序中保留10个数据存储单元:x1:被乘数m2:乘数的尾数x2:乘数e

p:乘积的指数e1:被乘数的指数mp:乘积的尾数ml:被乘数的尾数product:乘积e2:乘数的指数temp:暂存单元程序清单如下:.title"zh24.asm".mmregs.defstartSTACK.usect"S

TACK",100;64H.bssx1,1.bssx2,1.bsse1,1.bssm1,1.bsse2,1.bssm2,1.bssep,1.bssmp,1.bssproduct,1.bsstemp,1.datatabl

e:.word3*32768/10;0.3.word-8*32768/10;-0.8.textstart:STM#STACK+100,SP;设置堆栈指针MVPDtable,x1;将x1和x2传送至数据存储器MVPDtable+1,x2LDx1,16,A;将x1规格化为浮点数EXPASTT,e1;保

存x1的指数NORMASTHA,m1;保存x1的尾数LDx2,16,A;将x2规格化为浮点数EXPASTT,e2;保存x2的指数NORMASTHA,m2;保存x2的尾数CALLMULT;调用浮点乘法子程序end:BendMULT:SSBXFRC

TSSBXSXMLDe1,A;指数相加ADDe2,ASTLA,ep;乘积指数→epLDm1,T;尾数相乘MPYm2,A;乘积尾数在累加器A中EXPA;对尾数乘积规格化STT,temp;规格化时产生的指数→tempNORMASTHA

,mp;保存乘积尾数在mp中LDtemp,A;修正乘积指数ADDep,A;(ep)+(temp)→epSTLA,ep;保存乘积指数在ep中NEGA;将浮点乘积转换成定点数STLA,temp;乘积指数反号,并且加载到T寄存器LDtemp,T;再

将尾数按T移位LDmp,16,ANORMASTHA,product;保存定点乘积RET

小橙橙
小橙橙
文档分享,欢迎浏览!
  • 文档 25747
  • 被下载 7
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?