結(jié)論
本文向您提供了對 IBM MASS 庫以及 IBM XL C/C++ 和 XL Fortran 匯編器的自動向量化功能的描述。另外,本文演示了對范例程序(離散 Fourier 轉(zhuǎn)變)使用各種匯編器選項的操作,向您展示了通過使用 MASS 自動向量化的自動調(diào)用功能,使得與以前版本相比速度提高了 8.94 倍的效果。
這種演示想要通過一種程序來鼓勵用戶,這種程序會訪問數(shù)學函數(shù)以驗證可用的匯編器選項,并從 IBM XL C/C++ 或者 XL Fortran 匯編器的自動向量化加速中獲益。
附錄 1 – Fortran DFT 源程序
subroutine dft (x, a, phi , n)
real*8 x(n), a(n), phi(n)
integer n
! Compute discrete Fourier transform of real inputs ! x(i) and convert to polar form.
real*8, parameter :: pi=3.1415926535897932384d0
real*8 y_re(n), y_im(n), t, term_re, term_im
intrinsic exp, cos, sin, sqrt, atan
y_re(1:n) = 0.d0
y_im(1:n) = 0.d0
do k=1,n
! compute y(k), k-th DFT output
do i=1,n
! compute i-th term of y(k):
! x(k)*exp(-2*pi*I*(k-1)*(i-1)/n)
! compute real and imaginary parts of i-th term
! using exp(I*t)=exp(t)*(cos(t)+I*sin(t))
t = -2.d0*pi*(k-1)*(i-1)/n
term_re = x(i) * cos(t) * exp(t)
term_im = x(i) * sin(t) * exp(t)
! add term to sum
y_re(k) = y_re(k) + term_re
y_im(k) = y_im(k) + term_im
end do
end do
! transform y to polar coordinates
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |