以文本方式查看主題 - 曙海教育集團論壇 (http://www.xinguifushi.cn/bbs/index.asp) -- DSP5000技術討論 (http://www.xinguifushi.cn/bbs/list.asp?boardid=28) ---- TMS320C67x DSP Library在程序開發中的應用 (http://www.xinguifushi.cn/bbs/dispbbs.asp?boardid=28&id=1586) |
-- 作者:wangxinxin -- 發布時間:2010-11-22 9:22:08 -- TMS320C67x DSP Library在程序開發中的應用 美國德州儀器(TI)公司的數字信號處理器(DSP)以其處理速度快,功能強大,易于使用,且有開發軟件支撐等優點而廣泛應用于通信、電子、自動控制等領域。一個完整的DSP系統應當由硬件和軟件兩部分組成。在硬件(主要是DSP芯片)相同時,系統的性能將主要取決于軟件部分的效率。而在相同的硬件平臺上,不同程序員編寫的軟件效率相差很大,軟件效率已成為影響DSP系統性能的一個重要因素。要充分發揮D-SP芯片的性能,就必須編寫高效率的程序。一般在DSP進行運算時,有些操作會頻繁出現(如卷積、FFT、FIR濾波等),完成這些操作的程序的效率直接影響整個軟件部分的效率。為此,TI公司提供了一系列庫函數(TI DSP Library,以下簡稱DSP Lib)來完成這些操作。這些庫函數既可減少程序員的工作量,又可提高程序效率,因此,在程序開發中,合理地使用這些庫函數,將大大提高系統性能。 1 TI DSP Library簡介 1.1 TI DSP Library的特點 DSP Lib的核心實際上是一系列經過手工優化的匯編程序代碼,這些代碼封裝在后綴名為.lib的文件中,可用于完成各種運算。它們對外是不可見的。這些程序(庫函數,routines)可被C程序調用。由于經過了手工優化,它們的效率都非常高。由于不同系列DSP芯片的指令集不同,因此,不同系列DSP芯片的DSP Lib也是不同的,如TMS320C5000的DSP LIb就不能用于TMS320C6000。但是,各個系列DSP Lib的基本組成是相同的,一個完整的DSP Lib通常由Lib文件夾、include文件夾和其它輔助文件組成。其中lib文件夾用于存放*.lib文件,其內部封裝著手工優化的匯編程序代碼,是一個DSP Lib的核心部分。有的DSP Lib還有*.src文件,這些*.src文件主要是用C語言和匯編語言編寫的程序源代碼。使用歸檔器可從中提取出這些源代碼;而include文件夾用于存放各個庫函數的頭文件,通常這些文件分為C程序頭文件和匯編程序頭文件兩部分。 1.2 TI DSP Library的下載和安裝 由于DSP Lib種類繁多,且屬可選模塊,通常的DSP開發環境(CCS,Code Composer Studio)并沒有配備DSP Lib。因此,使用一個DSP Lib之前,必須進行DSP Lib的下載和安裝。 所謂下載,就是在TI公司網站WWW.ti.com上免費下載各種DSP Lib;而所謂安裝,就是在DSP Lib下載完畢后,雙擊安裝文件,以將它安裝在計算機中選定的位置(默認位置為C:\ti)。安裝之后,即可在程序開發中使用DSP Lib的庫函數。 1.3 TI DSP Library的使用 按處理數據類型的不同,TI DSP分為定點(fixed-point)DSP和浮點(floating-point)DSP。由于浮點DSP既有定點指令集,又有浮點指令集,因此,本文選取浮點DSP系列TMS320C67x的DSP Lib,并且選取了TMS320C67x DSP Library和TMS320C67x FastRTS Library兩個DSP Lib,前者主要針對數字信號處理的常用操作,后者則針對一般數學運算的通用操作。 2 TMS320C67x DSP Library的應用 當DSP進行數據處理時,卷積、FFT、FIR濾波等操作頻繁出現,故在程序開發中,使用DSP Lib來完成這些操作將大大提高整個程序的效率并簡化編程。TMS320C67x DSP Library就是這樣的一個DSP Lib,它的lib文件夾內含庫文件dsp67x.lib和源文件dsp67x.sr、dsp67x_C.sr-c、dsp67x_sa.src。TMS320C67x DSP Library主要用于TMS320C67x系列DSP芯片的程序開發,使用它可完成FFT運算。 2.1 TMS320C67x DSP Library的使用 使用TMS320C67x DSP Library的第一步是將其核心文件“dsp67x.lib”加入到當前工程中,相關編譯鏈接參數為“-ldsp67x.lib”;接著,將存儲頭文件的include目錄所在路徑添加到工程搜索路徑中,其相關編譯鏈接參數為“-i pathname”,具體操作可參考TI公司的有關文獻。選取該DSP Lib中的庫函數“DSPF_sp_cfftr2_dit()”可完成FFT運算,它使用的是基2的時間抽取算法,具體形式如下: ![]() 同時,該庫函數還有一個對應的頭文件“dspf_sp_cfftr2_dit.h”,使用時可將其包含到調用該庫函數的程序中。此時,該庫函數就可以像一般子程序一樣被其他程序調用,具體使用代碼如下: ![]() 為了便于比較,可使用歸檔器指令“ar6x”從該DSP Lib的源文件“dsp67x_c.src”中提取出庫函數的源代碼,以得到文件“sp_cfftr2_ dit.c”。所有歸檔器指令的命令文件都存儲在CCS的安裝目錄下,這里,“ar6x”的使用格式為: ar6x-x dsp67x_c.src sp_cfftr2_dit.c 從“sp_cfftr2_dit.c”中可得到庫函數“DSPF_sp_cfftr2_dit()”的C語言源代碼,相應的C程序為“void sp_cfftr2_dit(float*x,float*w,short n)”,該程序可以像一般子程序一樣被主程序調用。源函數和庫函數的形式完全相同。實際上,庫函數就是對源函數的程序代碼進行手工優化的結果。 2.2 性能分析 分別使用庫函數和源函數可完成FFT運算。并可用CCS自帶的剖析工具“Profiler”來分析兩個函數由于編程方式的不同所帶來的運行時間上的差異。改變輸入數組的長度,可得到如表1所列的一組數據。由表1可以看出,庫函數的效率遠遠高于源函數,其效率的提高量隨著輸入數據長度的變化而變化,最高的效率可提高40倍(40.98-1=39.98),最低仍在25倍左右,而且該DSP Lib的其他庫函數也有相近的測試結果。雖然用該DSP Lib的庫函數后,程序效率可以提高一個數量級,對于時間限制較為嚴格的系統,特別是實時系統,這仍然是非常有用的。 庫函數和源函數相比,其效率有了很大提高,但這種提高是有代價的。它主要表現為通用性降低。其原因是為了最大限度的提高效率,在對代碼進行手工優化的過程中,引入了一些強假設,同時,使用了大量的操作合并、并行處理等簡化手段,這必然導致庫函數的通用性降低。例如,庫函數“DSPF_sp_cfftr2_dit()”使用時就會受到以下條件的限制: (1)輸入數組的長度必須是2的冪級數,且不得小于32; (2)輸入數組x和旋轉因子數組w必須按雙字對齊方式存儲,即數組起始地址的末3位必須是零; (3)數據的存儲格式必須是小端模式(Little Endian); (4)執行期間可接收中斷,但不予響應,這可能導致一些實時事件得不到及時響應。
|