當(dāng)前位置:首頁 > 實用文檔 > 計算機硬件技術(shù) > 正文

大點數(shù)FFT在“申威26010”上的并行優(yōu)化

浙江大學(xué)學(xué)報(工學(xué)版) 頁數(shù): 9 2023-09-21
摘要: 根據(jù)“神威·太湖之光”超級計算機所用國產(chǎn)“申威26010”處理器的架構(gòu)特點和編程規(guī)范,提出針對大點數(shù)FFT的眾核并行優(yōu)化方案.該方案源自經(jīng)典的Cooley-Tukey FFT算法,通過將一維大點數(shù)數(shù)據(jù)迭代分解為二維小規(guī)模矩陣進行并行加速.為了解決矩陣“列FFT”的讀寫、轉(zhuǎn)置和計算問題,提出“列均分-行連續(xù)”的讀寫策略,通過對數(shù)據(jù)進行合理的分配、重排、交換,結(jié)合SIMD向量化、旋...

開通會員,享受整站包年服務(wù)立即開通 >