电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

北邮大三下计算机系统结构实验四代码优化

北邮大三下计算机系统结构实验四代码优化_第1页
1/6
北邮大三下计算机系统结构实验四代码优化_第2页
2/6
北邮大三下计算机系统结构实验四代码优化_第3页
3/6
课程名称: 计算机系统结构 实验名称: 代码优化实验 班 级: 09211311 姓 名: heifrank 学 号: 日 期: 2012 年 4 月 21 日 一、实验目的: 学习简单编译优化方法,观察采用编译优化方法所带来的性能的提高。 二、实验原理: 采用静态调度方法重排指令序列,减少相关,优化程序 三、 实验核心思想 通过观察实验二中的代码,我们发现程序中主要的几个 stalls 发生的地方为程序初始化的部分以及进行阶乘计算的过程中。因此我们主要在前一段初始化的代码上实现优化。 四、 优化程序代码清单及注释说明: ;--------------------------------------------------------------------------------- ;*********** coded by heifrank ************* ;--------------------------------------------------------------------- ;Program begin at symbol ;requires module INPUT ;read two vectors from stdin and calculate the sum ;(type: double,vectorLength 16) ;the result is written to stdout ;--------------------------------------------------------------------- .data VectorLength: .word 16 Vector1: .word 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 Vector2: .word 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 Printf1: .asciiz "Vector =" Printf2: .asciiz " %f" .align 2 PrintPrompt: .word Printf1 PrintPar: . word Printf2 Result: .space 4 .text main: ;**** Print prompt "Vector =" addi r14,r0,PrintPrompt trap 5 addi r2,r0,0 lw r20,VectorLength Loop: ld f10,Vector1(r2) ld f12,Vector2(r2) addi r2,r2,4 cvti2d f0,f10 cvti2d f2,f12 subi r20,r20,1 addd f4,f2,f0 ;add D2=D0+D1 ;**** Finish,write result into stdout sd Result,f4 addi r14,r0,PrintPar trap 5 ;addi r2,r2,4 ;subi r20,r20,1 bnez r20,Loop ;**** End trap 0 四、实验分析: 1) 观察成寻中出现的数据/结构/控制相关,指出程序中出现上述现象的指令 组合。 (FORWARD 技术关闭,浮点运算部件各一个,延迟为 4) Cvti2d f2,f12 Subi r20,r20,0x1 Addd f4,f2,f0 ; RAW 相关 Sd Result(r0),f4 ; RAW 相关 和优化之前相比,总花费时钟周期为 348(优化前为 413),总执行...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

北邮大三下计算机系统结构实验四代码优化

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部