首頁 考試吧論壇 Exam8視線 考試商城 網(wǎng)絡(luò)課程 模擬考試 考友錄 實(shí)用文檔 求職招聘 論文下載
2011中考 | 2011高考 | 2012考研 | 考研培訓(xùn) | 在職研 | 自學(xué)考試 | 成人高考 | 法律碩士 | MBA考試
MPA考試 | 中科院
四六級(jí) | 職稱英語 | 商務(wù)英語 | 公共英語 | 托福 | 雅思 | 專四專八 | 口譯筆譯 | 博思 | GRE GMAT
新概念英語 | 成人英語三級(jí) | 申碩英語 | 攻碩英語 | 職稱日語 | 日語學(xué)習(xí) | 法語 | 德語 | 韓語
計(jì)算機(jī)等級(jí)考試 | 軟件水平考試 | 職稱計(jì)算機(jī) | 微軟認(rèn)證 | 思科認(rèn)證 | Oracle認(rèn)證 | Linux認(rèn)證
華為認(rèn)證 | Java認(rèn)證
公務(wù)員 | 報(bào)關(guān)員 | 銀行從業(yè)資格 | 證券從業(yè)資格 | 期貨從業(yè)資格 | 司法考試 | 法律顧問 | 導(dǎo)游資格
報(bào)檢員 | 教師資格 | 社會(huì)工作者 | 外銷員 | 國際商務(wù)師 | 跟單員 | 單證員 | 物流師 | 價(jià)格鑒證師
人力資源 | 管理咨詢師考試 | 秘書資格 | 心理咨詢師考試 | 出版專業(yè)資格 | 廣告師職業(yè)水平
駕駛員 | 網(wǎng)絡(luò)編輯
衛(wèi)生資格 | 執(zhí)業(yè)醫(yī)師 | 執(zhí)業(yè)藥師 | 執(zhí)業(yè)護(hù)士
會(huì)計(jì)從業(yè)資格考試會(huì)計(jì)證) | 經(jīng)濟(jì)師 | 會(huì)計(jì)職稱 | 注冊(cè)會(huì)計(jì)師 | 審計(jì)師 | 注冊(cè)稅務(wù)師
注冊(cè)資產(chǎn)評(píng)估師 | 高級(jí)會(huì)計(jì)師 | ACCA | 統(tǒng)計(jì)師 | 精算師 | 理財(cái)規(guī)劃師 | 國際內(nèi)審師
一級(jí)建造師 | 二級(jí)建造師 | 造價(jià)工程師 | 造價(jià)員 | 咨詢工程師 | 監(jiān)理工程師 | 安全工程師
質(zhì)量工程師 | 物業(yè)管理師 | 招標(biāo)師 | 結(jié)構(gòu)工程師 | 建筑師 | 房地產(chǎn)估價(jià)師 | 土地估價(jià)師 | 巖土師
設(shè)備監(jiān)理師 | 房地產(chǎn)經(jīng)紀(jì)人 | 投資項(xiàng)目管理師 | 土地登記代理人 | 環(huán)境影響評(píng)價(jià)師 | 環(huán)保工程師
城市規(guī)劃師 | 公路監(jiān)理師 | 公路造價(jià)師 | 安全評(píng)價(jià)師 | 電氣工程師 | 注冊(cè)測(cè)繪師 | 注冊(cè)計(jì)量師
繽紛校園 | 實(shí)用文檔 | 英語學(xué)習(xí) | 作文大全 | 求職招聘 | 論文下載 | 訪談 | 游戲

二級(jí)C++:怎樣提高調(diào)用數(shù)學(xué)函數(shù)的程序的性能

二級(jí)C++:怎樣提高調(diào)用數(shù)學(xué)函數(shù)的程序的性能。

  自動(dòng)向量化的匯編器選項(xiàng)

  您可以使用以下的幾個(gè)選項(xiàng)來匯編程序:

  -qhot -qnostrict (for Fortran)

  -qhot -qnostrict –qignerrno (for C/C++)

  -qhot -O3

  -O4

  -O5

  當(dāng)您在使用這些選項(xiàng)集中的一個(gè)時(shí),通過調(diào)用等價(jià) MASS 向量函數(shù)(除了對(duì)以下函數(shù)的訪問除外:vatan2、vsatan2、 vdnint、 vdint、 vcosisin、vscosisin、vqdrt、vsqdrt、vrqdrt、vsrqdrt、vpopcnt4、vpopcnt8、vexp2、 vexp2m1、vsexp2、 vsexp2m1、vlog2、 vlog21p、 vslog2 和 vslog21p),匯編器會(huì)自動(dòng)嘗試對(duì)系統(tǒng)數(shù)學(xué)函數(shù)的訪問向量化。如果匯編器不能對(duì)程序進(jìn)行向量化,它會(huì)自動(dòng)試著調(diào)用等價(jià) MASS 標(biāo)量函數(shù)。對(duì)于自動(dòng)化的標(biāo)量或者向量,匯編器會(huì)使用匯編器庫 libxlopt.a 中包含的 MASS 函數(shù)的版本。您不需要向代碼中的 MASS 函數(shù)添加任何特意的調(diào)用,或者鏈接 xlopt 庫。

  除了一系列的選項(xiàng)之外,當(dāng) -qipa 選項(xiàng)處于可用狀態(tài)時(shí),如果匯編器不能進(jìn)行向量化,那么它會(huì)試著在決定調(diào)用它們之前去內(nèi)聯(lián) MASS 標(biāo)量函數(shù)。

  如果您想要取消自動(dòng)向量化的激活,那么您可以添加選項(xiàng) –qhot=novector。

  用例研究

  接下來的部分是一個(gè)實(shí)際程序的范例 — 一個(gè)離散的 Fourier 轉(zhuǎn)變(DFT) — 顯示了在匯編不同匯編器選項(xiàng)時(shí)的改善結(jié)果。程序已經(jīng)足夠簡單以方便演示,然后又足夠的復(fù)雜以提供非瑣細(xì)的優(yōu)化機(jī)會(huì)。

  兩個(gè)程序的計(jì)時(shí)都是在附錄 3 中給出的驅(qū)動(dòng)器程序完成的,運(yùn)行的環(huán)境是在 4.704 GHz 下運(yùn)行的 POWER6 電腦。

  附錄 1 顯示了 Fortran DFT 源程序。它包含了一個(gè)嵌套的循環(huán),該循環(huán)會(huì)調(diào)用 exp()、cos() 以及 sin(),接下來是一個(gè)調(diào)用 sin() 和 sqrt() 的循環(huán)。程序會(huì)使用 -O3(它并不能進(jìn)行自動(dòng)向量化) 并使用 –O4 (它能使用自動(dòng)向量化)。

  注意自動(dòng)向量化帶來的好處會(huì)隨著問題規(guī)模的增加而增加,最終當(dāng)問題的規(guī)模達(dá)到 2000 時(shí)加速的程度會(huì)達(dá)到 8.94x 。

  附錄 2 顯示了附錄 1 中 Fortran DFT 程序的 C 版本(它包含了一個(gè)虛 consume() 路徑,這樣匯編器的內(nèi)部程序化分析[IPA]就不能看到,計(jì)算的結(jié)果實(shí)際上在演示范例中并沒有用得上,并因此可以改善整個(gè)的程序)。

  程序?qū)?huì)使用 -O3(它并不會(huì)提供自動(dòng)向量化) ,使用 -O4 (它提供自動(dòng)向量化),使用 –O5 (它提供自動(dòng)向量化并提供 IPA)。

  正如在 Fortran 范例中演示的那樣,自動(dòng)向量化帶來的好處隨著問題規(guī)模的增加而增加,最后當(dāng) n=2000 的時(shí)候達(dá)到了。另外,IPA 在 -O5 處提供的活化能夠提供一個(gè)額外的 1.22x 加速,因?yàn)樗梢詻Q定輸入與輸出沒有別名(這就是說,它沒有在內(nèi)存中重疊),允許它去向量化進(jìn)行極坐標(biāo)的轉(zhuǎn)變。-O5 在 –O3 的基礎(chǔ)上加速的程度是 7.33x 。

上一頁  1 2 3 4 5 6 7 8 9 下一頁
  相關(guān)推薦:2010年9月計(jì)算機(jī)等級(jí)考試精華備考資料匯總
       計(jì)算機(jī)等級(jí)考試二級(jí)VB上機(jī)試題及答案匯總
       計(jì)算機(jī)等級(jí)考試二級(jí)VB模擬試題及答案匯總
文章搜索
版權(quán)聲明:如果計(jì)算機(jī)等級(jí)考試網(wǎng)所轉(zhuǎn)載內(nèi)容不慎侵犯了您的權(quán)益,請(qǐng)與我們聯(lián)系800@exam8.com,我們將會(huì)及時(shí)處理。如轉(zhuǎn)載本計(jì)算機(jī)等級(jí)考試網(wǎng)內(nèi)容,請(qǐng)注明出處。