高光譜成像儀作為精密的光學儀器,不僅可以獲得圖像上每個點的光譜數(shù)據(jù),而且還可以獲得任一譜段的圖像信息。但由于其采集的光譜數(shù)據(jù)具有波段多、分辨率高、數(shù)據(jù)維度高、冗余性強等特點,因此需要對光譜數(shù)據(jù)進行預處理,以提升建模數(shù)據(jù)的準確性。本文對高光譜成像儀的原理及光譜數(shù)據(jù)的預處理方法做了介紹。
高光譜成像儀的工作原理:
高光譜成像技術是利用成像光譜儀對目標物體在光譜覆蓋范圍內(nèi)的數(shù)十或數(shù)百條譜線進行連續(xù)掃描成像,在獲得目標物體外部特征圖像信息的同時,也能獲得反應其內(nèi)部成分的光譜信息。典型的色散型成像光譜儀采用連續(xù)掃描的方式進行成像,其主要由光源、電控移動臺、色散元件、面陣探測器等幾部分組成,如下圖所示。
當光源照射在電控移動臺上的目標樣品時,樣品反射光經(jīng)過成像鏡頭、狹縫,再經(jīng)由光柵等光學器件后,按波長色散并成像于CCD像面。由于狹縫只允許很窄的樣品條帶圖像通過,因此當樣品在電動平臺的連續(xù)移動掃描下,能夠得到連續(xù)的一維影像及光譜信息。計算機上的圖像采集軟件對圖像進行采集和存儲,進行處理后可以得到樣品的三維高光譜圖像。通過對高光譜圖像進行特征提取、圖像融合等,可以得到樣品每個像素點的反射光譜(如下圖所示,X方向表示條帶的一列像元、Y方向表示連續(xù)成像的軌跡、入方向代表各像元在不同波長下的光譜信息)。由于樣品不同部位具有不同的特征光譜,據(jù)此可以分析和判斷目標的屬性。
高光譜成像儀光譜數(shù)據(jù)的預處理方法:
由于采集到的三維高光譜數(shù)據(jù)中的光譜信息除了含有有用的信息外,還含有其他大量的隨機噪聲和與樣本性質(zhì)無關的信息(如儀器噪音、雜光散射和基線漂移等),這些因素都會對光譜信息產(chǎn)生一定的干擾,甚至會影響所建模型的性能和預測效果。因此,有效地消除光譜信息中的噪聲和無關信息是建立良好的分析預測模型的關鍵。
通過對光譜信息進行有效的預處理可以減弱甚至消除其他與樣本性質(zhì)無關的信息對光譜信息的影響,為后續(xù)建立預測精度高、穩(wěn)健性好的分類判別模型奠定基礎。目前,常用的預處理方法有變量標準化算法、多元散射校正算法、導數(shù)算法、基線校正、平滑算法和去趨勢法等。
1.變量標準化算法(SNV)
變量標準化(Standard Normalized Variate,簡稱SNV)主要是用來消除由光散射所引起的光譜誤差。SNV校正認為,在每一條光譜中各波長點的吸光度值應滿足一定的分布規(guī)律。在這一假設的前提下,SNV是在原始光譜減去該條光譜曲線的平均光譜值,然后除以該條光譜曲線的標準偏差,其實質(zhì)是使原始光譜數(shù)據(jù)標準正態(tài)化處理。
2.附加散射校正算法(MSC)
附加散射校正(Multiplicative Scatter Correction,簡稱MSC)是由Geladi等人提出,其主要目的是通過消除因顆粒大小及顆粒分布不均勻產(chǎn)生的散射影響,增強與成分含量相關的光譜吸收信息,并獲得較“理想”的光譜。MSC方法認為,每一條光譜都應該與“理想”的光譜成線性關系,但真正“理想”的光譜是無法得到,所以一般用校正集的平均光譜來近似。即,每個樣品的任意波長點下的反射吸光度值與其平均光譜的相應吸光度的光譜是近似線性關系,而且可以通過光譜集線性回歸獲得該直線的截距和斜率,并用來校正每條光譜。截距大小可以用來反應樣品獨特反射作用,而斜率大小則用來反映樣品的均勻性。
3.平滑算法(Smoothing)
由光譜儀采集到的光譜信息中常常疊加著很多的隨機誤差,而平滑算法是常用來消除噪聲的方法。其基本思路是通過多次選取平滑點前后的特定點進行平均或擬合來降低噪聲,從而提高信噪比。常用的平滑方法有:Savitzky-Golay卷積平滑法、移動平均平滑法和指數(shù)平均平滑。
4.去趨勢法(De-trending)
去趨勢算法(De-Trending)一般可以用于消除經(jīng)SNV處理后的光譜的基線漂移,也可以單獨使用。該算法比較直接,先按多項式將光譜xi的吸光度和波長擬合出一條趨勢線di,再從原始光譜中減掉趨勢線(xi-di)。經(jīng)過去趨勢法處理后,其波峰和波谷的特征更加明顯。
5.基線校正(Baseline)
在光譜分析中,由于樣品自身的不均性、儀器背景或其他因素等影響,導致所測樣品的譜圖經(jīng)常會出現(xiàn)傾斜或漂移現(xiàn)象,若不加處理,會影響校正模型的性能和對未知樣品預測結(jié)果的準確性。
高光譜圖像數(shù)據(jù)的特點:
1.光譜波段范圍較寬且分辨率較高
傳統(tǒng)R、G、B或黑白圖像的光譜范圍一般都在可見光,波段數(shù)在幾個至十幾個,而高光譜儀獲得圖像的光譜范圍可以從可見光、近紅外、甚至延伸到中紅外,波段數(shù)可達到幾十至數(shù)百個,從而形成一條連續(xù)而飽滿的光譜反射率曲線,連續(xù)性較強,分辨率在2nm-10nm之間。
2.高光譜圖譜數(shù)據(jù)信息較為豐富
由于高光譜圖像的光譜分辨率較高,波段較寬,由此產(chǎn)生了許多窄波段的光譜信息,這些光譜信息之間關聯(lián)性較強,為高光譜圖像數(shù)據(jù)帶來了大量、豐富的信息。
3.高光譜圖像有較為豐富的數(shù)學分類模型
高光譜圖像的復雜性致使它的數(shù)據(jù)模型較為豐富,如圖像分類模型、光譜差異模型、特征提取模型等,使得圖譜數(shù)據(jù)的處理、分析、提取等更加豐富和靈活。