深度學習與天文影像一窺星系的形態與物理| CASE 報科學

2025-02-01

文章推薦指數： 80 %

投票人數：10人

也許對機器學習有初步認識的你，知道深度學習常常被用於圖像分辨，舉凡如人臉、物件，甚至是指紋等分析。

在最近幾年，天文學家也順水推舟，將其應用在天文 ... 人工智慧&電腦、資料科學 2020年10月14日2021年12月27日 intern 形態,星系,電腦視覺撰文/BalboaCrenshaw（現職為數據科學家）星系的形態也許對機器學習有初步認識的你，知道深度學習常常被用於圖像分辨，舉凡如人臉、物件，甚至是指紋等分析。

在最近幾年，天文學家也順水推舟，將其應用在天文影像的分析與分類。

當中最著名、最廣泛的應用，莫過於星系形態（Morphology）的分類！也許你對星系的「形態」這個詞感到陌生，但是這門學問其實就是研究星系的「形狀」（shape）。

就像人有高矮胖瘦，星系也有各式各樣的形態，就像圖一這張「哈伯音叉圖」（Hubbletuning-forkdiagram）：圖一、哈伯音叉星系分類圖（圖片來源：NASA&ESA）上圖最左邊，代表形狀偏向圓與橢圓的「橢圓星系」（Ellipticals）；右邊則是形狀與我們銀河系相近的「螺旋星系」（Spirals）；而螺旋星系又可以分為一般的螺旋星系，與中心有棒狀系統的「棒旋星系」（Bar-spiral）。

把這三個大分支畫在一起，就像一個音叉一般，所以有了「音叉圖」這個稱號。

這個音叉圖星系分類法，是由天文學家EdwinHubble所提出，已有百年歷史。

隨著科學知識的進展，更複雜與更符合物理事實的星系形態分類也相繼被提出，不過基於篇幅，這裡就暫時不去討論更多細節。

然而要注意的是：一個世紀以前，在機器學習與大數據分析誕生之前，甚至連電腦都還沒出現的時候，天文學家，尤其是那些研究星系天文物理的人，就已經著手對星系進行分析與分類（classification），並且完全靠著他們的肉眼！ 20世紀中期之後，隨著大型天文望遠鏡的誕生，星系影像也大量產生，星系形態之間的界線也越來越模糊，天文學家意識到也許需要電腦的輔助。

終於，大數據分析、深度學習與人工神經網路幫了星系天文學家一個大忙。

2015年，一群天文學家將深度學習技術運用在星系形態的分類上。

約五萬個星系，圖二只是他們所得到的一部分結果。

由上而下，每一行分別是：橢圓、螺旋、橢圓與螺旋混合形、不規則螺旋與不規則形星系，各有不同的形態，你分辨的出來嗎？圖二、運用深度學習進行星系形態分類的結果（圖片來源：M.Huertas-Companyetal.,2015.）值得一提的是，這些星系影像正是由大名鼎鼎的哈伯太空望遠鏡（HubbleSpaceTelescope）所拍攝，就在同一個Hubble提出音叉分類圖的一個世紀之後。

背後的物理星系的形態固然重要，但天文學家更在乎背後的「物理」：哪些星系比較活躍？哪些星系聚集了較多的星星？哪些星系在宇宙早期就生成了？這些問題也許比「哪些星系是橢圓形」還來的重要。

於是就在最近，天文學家又開始為「星系的物理」進行分類。

要為星系的物理進行分類，最直覺的方式就是以該星系所處的演化階段為依據。

簡單來說，我們可以依據星系的影像，來分辨該星系目前正經歷其生命中的哪一個「階段」。

當然，關於星系的演化，各類學說目前可說是百家爭鳴；這裡要介紹的，是在星系生成的過程中，一段稱作「藍塊」（Bluenugget，BN）的階段。

在這個階段，星系的中心有大量恆星生成，溫度相當高，顏色也因此偏藍。

懂了關於「藍塊」的物理，就可以開始設計機器學習的模型了。

天文學家模擬出35個虛擬星系，並將每個星系不同時期、不同觀測角度的影像集合起來，共約五萬張「人工星系影像」。

因為是人工模擬出的影像，所以每一個都有相對應的「標記」（label），分別是：「前藍塊階段」（Pre-BN）、「藍塊階段」（BN）與「後藍塊階段」（Post-BN）（如圖三）。

這五萬張帶有標記的影像，便是後續機器學習時所使用的「訓練集」（Trainingset）。

圖三、訓練集中的12張人工星系影像。

上、中、下行分別為標記「前藍塊階段」（Pre-BN）、「藍塊階段」（BN）與「後藍塊階段」（Post-BN）三個階段（分類）。

你看得出來這些都是人工模擬產生的星系嗎？你分辨得出三種分類的影像有什麼不同嗎？（圖片來源：M.Huertas-Companyetal.,2018.）天文學家所使用的模型是「卷積神經網路」（Convolutionalneuralnetwork，CNN），這是一種屬於深度學習的人工神經網路。

如圖四所示，CNN的輸入端是星系的影像，影像資訊接著在三層的「卷積層」（Convolutionallayers）中進行運算，最後得到最佳的分類。

圖四、用以進行星系影像物理分類的CNN模型。

（圖片來源：M.Huertas-Companyetal.,2018.）就算肉眼實在難以分辨圖三的影像之間到底有哪些不同，但卻難逃電眼──CNN模型的正確率高達80%。

在天文學的挑戰在天文資訊與影像爆發的年代，深度學習無疑能夠幫助天文學家更有效率地運用這些資源，並了解影像背後的物理，但眼前的挑戰也不小。

例如：天文影像通常是遙遠、微弱的星光，影像中的「雜訊」不可不防，若未妥善處理則會大大影響機器學習的效率與準確度；此外，天文觀測所使用的波段不一，如何整合這些不同波段的影像十分重要。

當然，模型所表現出的誤差與不確定性，也不排除有更深層的原因，隱含了更多人類未知的物理。

參考資料 “TheHubbletuningfork–classificationofgalaxies“, spacetelescope.org,2020. M.Huertas-Companyetal.,“CatalogofVisual-likeMorphologiesinthe5CANDELSFieldsusingDeepLearning”, TheAstrophysicalJournalSupplementSeries,vol.221,no.1,p.8,2015. M.Huertas-Companyetal.,“DeepLearningIdentifiesHigh-zGalaxiesinaCentralBlueNuggetPhaseinaCharacteristicMassRange”, TheAstrophysicalJournal,vol.858,no.2,p.114,2018 (本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯) FacebookTwitterLineEmail分享 (Visited1times,1visitstoday) views ←肺癌有可能是吃出來的嗎? LIGO與VIRGO觀測到目前為止質量最大的重力波事件→ 找不到文章？好書推薦《心靈黑洞：意識的奧祕》《物理奇才奇事》諾貝爾物理獎得主楊振寧推薦《破解動物忍術》