高光譜成像儀作為精密的光學儀器,它在對樣品進行無損檢測時,不僅可以獲得樣品的光譜信息,還可得到樣品的圖像信息,其圖譜合一的優(yōu)勢以及優(yōu)越的光譜分辨能力為分析目標屬性提供了充分的數據信息。那么,高光譜成像儀的光譜數據怎么處理?預處理方法有哪些?下文為大家做了介紹,感興趣的朋友不妨了解一下!
高光譜成像儀高光譜數據的處理方法:
通過成像光譜儀采集獲得的高光譜圖像,首先要進行黑白校正(白板校正和暗場校正),即反射率的歸一化處理。然后,選取感興趣區(qū)域,提取感興趣區(qū)域內所有點的反射率光譜并取平均值。提取所有樣品的平均光譜,得到光譜數據矩陣。
其中每一個像素點都對應著一條完整的光譜曲線,每一條光譜曲線同樣對應著一副二維的幾何圖像。實驗中,樣品數量高達上千個,又有上百個波段,這往往導致光譜數據矩陣非常龐大。因此,如何有效地挖掘龐大數據結構的有效信息成為光譜分析技術需要解決的首要問題。通常,數據分析分為以下幾個步驟:
1.光譜預處理
預處理可以有效減少系統(tǒng)噪音、雜散光等對成像的影響,從而獲取信噪比高、背景干擾較低的數據。常用的光譜預處理方法有:平滑、歸一化、多元散射校正、求導、變量標準化等。
2.提取特征波長
光譜數據的高維及共線性問題往往降低模型的運算效率和精度。選取有效的特征波長不僅降低了維數問題,而且最大程度上包含樣品的原始信息,進而達到簡化運算的目的。常用的提取特征波長的方法有:回歸系數法、連續(xù)投影算法、載荷系數法、遺傳算法、競爭性自適應重加權算法等。
3.回歸或分類模型的建立
用提取的特征波長和待測參數建立回歸或分類模型。常用的建模方法有:主成分分析、多元線性回歸、主成分回歸、人工神經網絡、偏最小二乘法、最小二乘支持向量機等。
另外,以上所述的步驟僅僅是針對光譜的處理,而高光譜圖像還可以看作是每個波段圖像的疊加,這些圖像包含樣本豐富的空間分布屬性。圖像紋理反映像素的空間位置和亮度值變化,進而反映樣本幾何結構的變化。因此,通過提取高光譜圖像的紋理變量信息(包括對比度、方差、熵等)同樣可以建立相應的預測模型。
高光譜成像儀的光譜數據預處理方法:
成像光譜儀在采集數據的過程中容易受到類似儀器性能、樣本背景、電噪音等因素的影響,這導致獲得的光譜信號受噪音的干擾。所以,在得到所有樣品的原始光譜以后,需要對其進行預處理來提高光譜數據的信噪比,這也是為了更高效地挖掘光譜數據僅為保證預測模型的精度、穩(wěn)定性和可靠性。下文對光譜數據預處理方法:S-G平滑、多元散射校正和變量標準化作了介紹。
1.S-G平滑法
噪聲常常干擾光譜信號,也容易在建立模型時產生過擬合的現象。平滑處理通過對平滑點周邊一定窗口大小范圍內的數據點進行平均或擬合處理,可以求得平滑點的最佳估計值。這樣就減少了噪聲對數據點的干擾,提高了信噪比。常用的平滑處理包括移動平均平滑法和卷積平滑法,卷積平滑法基于最小二乘擬合的系數來建立濾波函數,對移動窗口內的光譜進行最小二乘多項式擬合。因此與簡單的平均計算相比,該算法具有較大的優(yōu)勢。
2.多元散射校正法
多元散射校正能夠有效消除散射的影響,進而增強和成分含量對應光譜的吸收信息。該算法首先需要建立待測樣品的“理想光譜”,即光譜的變化值與樣品的成分含量滿足線性關系。然后,基于該“理想光譜”對其他樣品的光譜進行修正??蓪嶋H應用中,獲取“理想光譜”非常困難,所以常常取所有樣品光譜的平均值來近似代替。
3.變量標準化
變量標準化可以用來校正樣品間由于散射引起的光譜誤差。由于每條光譜其波長點的吸光度符合一定的分布(比如正態(tài)分布),該算法每一條原始光譜值進行標準正態(tài)化處理,處理后的光譜數據均值為0,標準差為1。計算式為:Zi=(xi-μ)/σ。
式中,xi為原始光譜的吸光度,μ為所有光譜的平均值,σ為原始光譜的標準偏差。由于該算法是對每條光譜數據進行單獨校正,因此對于樣品間差異較大的光譜數據,采用變量標準化算法對其進行預處理十分有效。