Computational Imaging搞什麼鬼

Jerry 何吉瑞
Jul 27, 2023

--

從IEEE的blog隨便抓一張看起來漂亮的當封面…(ref: https://cmte.ieee.org/futuredirections/2021/12/15/neural-nano-optics/)

前言1:趁老闆出去兩週來耍廢(X),來更新一下快要長草的medium(O),其實這半年間一直有想要寫點什麼,但是都因為各種理由最後棄稿,等未來有機會再把那些棄掉的坑補一下

前言2:本文所提的研究領域分界定義都是主觀,大部分分類據我所知並沒有一個相對一致的標準,10個人就可能有11種標準

前言3:本文可能不太科普導向,會出現一定數量專有名詞,為避免翻譯偏差我盡量保持原文

「誒你的研究大概在做什麼」是大部分研究生都會遇到的問題,答案可能是電路設計、通訊系統等等,但說到我們的computational imaging,就連電資領域的人可能都會眉頭一皺想想這是啥,畢竟雖然相關研究存在已久,真正被視為一個獨立的領域也不過是近年的事,大部分人還是相對熟悉computer vision、image processing這些,所以打算用本文試圖解釋一,另外就是好像又是新的申請季節來了,提供一點資訊回饋社會

image processing/computer vision這十年來基本上是飛躍性發展 (圖片來源:中時電子報)

百家爭鳴的影像領域

在進入主題前講個故事,第一次思考到領域界定的問題,是在大四那年寫一篇關於自動對焦的paper,我寫出類似「deep learning在近年來大大改善computer vision相關應用」的句子,當時的指導教授就告訴我:「這樣寫不太對,我們的題目並不屬於computer vision,你要有detection這個動作,才叫做computer vision,你的方法屬於image processing」

當時心裡是覺得有點怪怪的,畢竟當時認知包括image classification、image segmentation、depth estimation等等,都是CVPR中炙手可熱的題目,難道這些都不屬於computer vision嗎?

後來我個人的解釋是,老師講的detection並不限於我們認知的object detection,只要是methods that extract semantic information from image (中文大概是 提取影像資訊的演算法開發) ,都可以歸類到computer vision,所以上那些題目都有涉及這件事,而image processing比較接近於提升影像本身的品質,例如noise reduction、upsampling和image compression等等,而這也比較接近UCSD上課的標準答案 (抱怨一下,用這種分類問題當成考試真的很有事)

簡單來說,輸入都是image,只要輸出semantic information就是computer vision,輸出image就是image processing,看似一刀兩斷,但是事情真的有這麼簡單嗎?照此邏輯, edge detection會被歸類在computer vision,而super resolution會被放到image processing,當然不能說錯,但是和讀者的直覺未必吻合

當然啦,大部分人其實沒有很在乎兩者差異,以兩者為名的課程內容多有重複,而兩個領域最大的conference,ICIP和CVPR,也是有很多相似題目,雖然從參加者的不同,還是明顯可以感受到兩邊Community的差異,不過近年來確實越來越類似,甚至和graphic的邊界也逐漸模糊了,只是如果有想要投入此領域人士,這個邊界問題還是值得思考一下的

任何成像系統和應用,都有可能是我們關心的 (圖片來源:本lab網頁)

Task Driven Imaging System

好,我們主要還是該討論computational imaging是個什麼,前面說過這是長期存在,但年來才被視為一個獨立的領域,簡單來說,本領域專注於「如何設計與應用一台相機」,更廣義一點說是成像系統,所以顯微鏡、螢幕、甚至如何拍攝黑洞都在我們的討論範圍

以個人經驗來說,我大學階段做的兩個project都可以被歸類於此,第一個是基於dual pixel (一種特殊的像素) sensor的自動對焦演算法開發,第二個是利用高解析度的OCT儀器,分析生物的健康狀況,都是特殊設計一種成像系統,來針對某種目的,但當時一個被歸類成image processing,一個是medical imaging,都沒想過要放在computational imaging

其中一個原因是computational imaging長期以來並不被視為一個夠大的獨立研究領域,典型的刊物/會議歷史也短,雖然說這類型的研究存在已久,但他們最多是把computational photography這樣的字放在key word list,本身還是歸類在graphics/image processing/computer vision,此類研究真正自立山頭大概是近20年的事情,所以大部分以computational imaging研究自居的教授都算年輕,在台灣你甚至很難以此為關鍵字找到實驗室

而本領域如果整個拉開,我們首先在設計透鏡上需要物理光學,在sensor上需要image processing的技術,在應用上則需要computer vision 的演算法幫助,進一步來說,我們在模擬光學路徑時還可能借用到Graphic中ray tracing的技術,正面來說是領域整合、軟硬通吃,反面來說…就是比較少相對獨特的技能與知識,大部分的domain knowledge其實都源自其他領域,也因此在paper survey的階段,我們常常要接觸非常多不同領域的知識

以本實驗室為例,我們合作的實驗室曾經來自設計穿戴式健康偵測裝置的、做化學光譜分析的、做神經影像的、海底影像的,以及做rendering的(相對接近了),大致上都是說「我們現在有某某需要,根據目前的成像系統,該如何改善來fit那個需求?」這樣的問題,所以在應用階段,我們會讀一些可能和電機領域差很遠的paper,除了成像系統如何運作、還有某某需要為何在化學/神經科學/海洋科學很重要等等

這邊稍微講細一點,就以我們最常見的透鏡成像來講,實際要探討下去都是很深的學問,更別說實際去光學桌搭儀器,這在大學階段幾乎是不會被訓練到,對於長期演算法開發的學生是個大挑戰,而說到演算法開發也有很多驚喜,不同的流派也有不同的開發理念,例如我們實驗室相對強調方法要interpretable,不會太欣賞一個Network直接硬train一發,而是希望讓solver的每個步驟都有清楚的動機,這樣做有好有壞,好處是讓方便解釋,壞處首先是interpretability不保證performance,再者是此類方法常常會走向複雜的數學,大多需要夠強的理論基礎才能撐住

看到這裡大概會知道本領域最挑戰性的點,就是容易遇到那種不熟悉又不好懂的paper,更別說闡述方式各異,不但要看懂,還要轉化成自己的語言,像專家一樣解釋,有時候拿到project,從評估方式到方法設計都要思考,而不是在給定的題目上衝數字,大部分人都帶著一定的background knowledge進來,但最後能用到的比例不一定很高

久違來講申請,如三年前一樣放一些準備旅美的球員應景?(ref: yahoo新聞)

如果你/妳想申請Computational Imaging相關實驗室

(免責聲明:以下純個人看法,一定有取樣誤差,不代表整體情況,也不代表任何實驗室實際招生狀況)

最後睽違三年在medium聊聊申請,由於現在台灣真正在做computational imaging的實驗室不多,以此自居的更少,潛在申請人大多來自image/signal processing、computer vision、或光學背景,因此申請首重的connection就會比較微妙一點,要像一些大領域一樣,找到真正認識的人然後一發強推過去並不容易,也沒有太多的前人經驗可以參考,會是一個相對高的挑戰

有些人可能會問此我們比較代表性的conference/journal,真正比較屬於我們領域的是ICCP (https://iccp2023.iccp-conference.org) ,品質大多不錯,但是這個規模相對其他影像相關的會議小了蠻多,作品曝光度不會太高,優點是相對容易找到人聊天或學術交流,journal方面就是近年崛起的Transactions on Computational Imaging,但其實大多老師反而不會主力攻這兩個,比較演算法導向的會主力丟CVPR,比較光學導向的會丟Optica,比較graphic導向會丟Siggraph,除了impact factor,更多的是教授本身的preference,不一定有一個公認的rank

值得一提的是,相較電路設計、通訊等領域,影像相關的題目相對入門門檻低,有些很應用導向的題目,甚至不一定需要信號與系統的背景知識,有些project甚至只要會打code就可以做,也因此這些題目有很多短週期的project,但與此同時積累的知識不一定夠紮實,如前文所述,本領域的守備範圍很大, computational imaging初心者大多有陣痛期,但如果是富有好奇心、喜歡多領域知識整合的人,會是一個值得考慮的選項

換個角度來說,就是相對不硬性要求申請者的背景,除了前面說的影像相關、光學設計之外,我們有接觸過signal processing或生物背景的申請人,但不論哪個背景進來,都會接觸到大量領域外的知識,如果是台灣電機系的申請人,由於大多是演算法開發背景,會在物理光學上需要多花一點心力

關於本領域的介紹先寫到這裡,一直以來都不太會寫結尾,如果日後有幸畢業,再來回顧一下自己對本領域的看法,到時候應該可以比較具體指出人事時地物的歷程XDD,最後還是強調,敝人我唸到第三年結束,都不一定能很清楚講述computational imaging是什麼東西,各大實驗室方向也差很多,為了避免取樣偏差,本領域的申請事前功課真的 真的很重要

--

--

Jerry 何吉瑞

台北出生長大22年後,目前在UC San Diego念不知到何時的PhD,小時候曾有夢想是當blogger,長大後發現還是言之無物,但希望能cover到一些比較少人討論到的地方,歡迎光臨(?