徠卡顯微系統(tǒng)公司有機會與 Lundberg 教授探討了運用人工智能 (AI) 和機器學習技術進行顯微圖像分析。她在實驗室開發(fā)的人工智能和機器學習模型有助于改進圖像采集以及隨后的處理和分析。例如,與使用傳統(tǒng)的分析方法相比,科學家們可以采用更高效的方法識別細胞和蛋白質(zhì)。此外,人工智能對于圖像分割也非常有用,圖像分割可幫助科學家獲得更好的定量數(shù)據(jù)并進行可靠的統(tǒng)計分析,并且在成像過程中進行幾乎實時的分析以便檢查動態(tài)細胞事件。這些模型還可以利用特定格式的空間信息,這些格式可與蛋白質(zhì)組學數(shù)據(jù)或單細胞測序數(shù)據(jù)等其他類型數(shù)據(jù)輕松整合。詳情請閱讀以下采訪。
Emma Lundberg 教授
瑞典 KTH 理工學院細胞生物學蛋白質(zhì)組學教授
她還是細胞圖譜項目的總監(jiān),該項目是瑞典人類蛋白質(zhì)圖譜(HPA)項目*的組成部分,后者是用于研究人類蛋白質(zhì)組的開源資源。細胞圖譜項目是 HPA 的一部分,提供人類細胞系中 RNA 和蛋白質(zhì)的表達及時空分布的高分辨率圖像。Lundberg 教授因其在繪制人蛋白質(zhì)組圖方面的創(chuàng)新研究而榮獲瑞典國家化學工程師協(xié)會(SKR)2017年度大獎。她還是瓦倫堡青年院士(技術類別,2017-2021 年)。
您能否給我們介紹一下您目前的研究工作?
Lundberg 教授:我是人類蛋白質(zhì)細胞圖譜(HPA)項目的總監(jiān),該項目涉及繪制人類細胞中的蛋白質(zhì)分布圖。在這個大型項目中,我們生成了許多高分辨率共聚焦圖像,目的是解釋蛋白質(zhì)在細胞中的模式和分布。這項工作相當重要,因為大約一半的人蛋白存在于兩個或多個細胞區(qū)室中,因此通常是兩種不同模式的混合。我們還研究數(shù)十種不同的細胞系,這些細胞系具有不同的形態(tài),呈現(xiàn)細胞器的方式也略有不同。在啟動該項目時,我們手動進行所有標注,然后逐漸建立機器學習模型,對蛋白質(zhì)分布模式進行分類。
您的研究工作如何在顯微成像中運用人工智能和機器學習技術?它能帶來哪些優(yōu)勢?
Lundberg教授: 使用機器學習模型可以節(jié)省大量時間,但是我相信真正的成功將取決于我們開發(fā)的模型能夠?qū)⒖臻g信息嵌入到一種格式中,將其與其他類型的分子測量數(shù)據(jù)整合,例如蛋白質(zhì)組學數(shù)據(jù)或單細胞測序數(shù)據(jù)。機器學習算法的另一個主要優(yōu)點是進行更加無偏性的圖像分析。例如,它可以幫助我們僅憑外觀就找到非常相似的細胞,或者我們可以通過異常檢測來發(fā)現(xiàn)罕見的細胞。
在 HPA 項目中,我們繪制了大多數(shù)人類蛋白質(zhì)的亞細胞分布圖,現(xiàn)在,我們開始研究那些在鄰近細胞之間的分布上容易發(fā)生變化的時間動力學和蛋白質(zhì)。為此,我們需要能夠在單細胞水平上量化空間模式的可靠模型,幫助我們了解細胞形態(tài)的細微變化。生物過程由某些蛋白質(zhì)的相互作用驅(qū)動,而且微小的空間重排可能有非常顯著的功能性后果,因此我們希望能夠識別并量化這些細微的差異。
在實時圖像分析方面,我希望新的顯微鏡可以擴大我們的視野,例如幫助我們預測細胞的周期位置,或者哪些細胞將進入凋亡階段,或者從明視場圖像預測細胞膜標簽和 DAPI 染色,以便能將所有這些增強特性實時添加到顯微鏡視圖中。我希望我們最終也會在數(shù)據(jù)驅(qū)動的圖像采集與人工智能驅(qū)動的圖像分析之間形成某種閉環(huán)。
能否請您再介紹一下,在采集圖像的同時能夠分析數(shù)據(jù)有何好處?
Lundberg 教授:在 HPA 項目中,我們有時會檢查罕見事件,例如特定的酶易位到罕見細胞的細胞核中,而它們的功能未知。當我們檢查細胞中的這些罕見的空間重新排列時,需要在成像過程中進行近實時的分析。這樣,我們可以根據(jù)事件具體調(diào)整圖像,尤其在研究動態(tài)事件時。進行頻繁的延時成像時,通過這種方法還可以進行稀疏成像以避免光毒性,而當我們探測到要研究的罕見事件時,我們可以選擇性地對該細胞成像。
相反,如果我們采用手動分析圖像的方法來分析這些罕見事件,就必須停止實驗、進行分析,然后重復實驗。
既然你們是自己開發(fā)這些技術,那么你們是否利用這些技術獲得實時結(jié)果呢?
Lundberg 教授:我們有一些可以實時運行的輕量級模型。不過,我們尚未實現(xiàn)閉環(huán),也沒有完成整合,但是我們希望在不久的將來實現(xiàn)這一目標。例如,我們開發(fā)了一種能夠從明視場圖像預測細胞膜染色的模型,通過該模型,我們能夠?qū)崿F(xiàn)細胞的高精度實時分割。這意味著我們可以在顯微成像過程中實時測量分割后細胞中的熒光。
圖像來源(人類細胞):人類蛋白質(zhì)圖譜
人工智能和機器學習技術可以為日常顯微成像工作帶來的主要價值是什么?
Lundberg 教授:人工智能驅(qū)動的分析可以優(yōu)化和簡化顯微圖像處理,可以改善信噪比、將圖像去卷積或大幅度增高分辨率。它在提高圖像質(zhì)量方面具有巨大的潛力,*改變了顯微成像領域。
在分析方面,機器學習算法可以為分析大型數(shù)據(jù)集創(chuàng)造全新的機會。使用現(xiàn)代顯微成像技術,我們可以生成非常大的顯微鏡數(shù)據(jù)集,而人工智能輔助分析則使我們能夠高效、準確地分析這些數(shù)據(jù)。
此外,我認為在成像方面,人工智能對圖像分析中常用的分割方法非常有用。良好的分割非常有幫助,能讓用戶獲得更好的定量數(shù)據(jù),進行可靠的統(tǒng)計分析。人工智能驅(qū)動并不總那么困難,它可以包括從細胞分割等一般模型到高級算法的各種方法。大多數(shù)生物學家很可能會發(fā)現(xiàn)機器學習算法在圖像分析中非常有用,沒有理由不去嘗試一下。
無需處理超大型圖像數(shù)據(jù)集的研究人員也能受益于人工智能輔助分析嗎?
Lundberg 教授:當然可以。我認為細胞分割將是他們肯定能從中受益的可用工具之一。機器學習算法還可在模式識別方面提供很大幫助,例如用于識別無標志物的特定細胞器。
未來,機器學習模型可用于挖掘開放的圖像存儲庫。此外,它還使我們有機會根據(jù)現(xiàn)有數(shù)據(jù)分析我們自己的成像數(shù)據(jù)。例如,即使您生成小型數(shù)據(jù)集,也可以看到您的表型是否與數(shù)據(jù)庫中的另一個表型匹配。
目前,將人工智能應用于顯微成像的圖像分析是否存在挑戰(zhàn)?
Lundberg 教授:是的,當然存在。有多種挑戰(zhàn):共享和管理海量的圖像數(shù)據(jù)集,滿足用于訓練人工智能模型的計算需求,以及為不習慣使用人工智能模型的研究人員開發(fā)易于使用的界面。可能會有許多障礙,具體要看專業(yè)領域。人工智能專家很可能希望開發(fā)更好的模型,而不習慣使用人工智能模型的顯微鏡工作者可能想要了解如何使用它們。我認為在機器學習算法的使用上有許多方面可以改進。
您認為是否有研究人員抗拒采用人工智能輔助分析?
Lundberg 教授:總的來說,我認為影像學界已很好地接受了基于人工智能的工具。我認為有些阻力是正常的,因為出現(xiàn)新的分析工具時總會出現(xiàn)這種情況。人工智能輔助圖像分割等迭代工具能夠讓用戶在手動修正時隨時了解最新情況,在訓練期間與模型交互,有助于研究人員對模型充滿信心,因為他們可以看到模型如何逐漸改進。但是,用戶當然必須認識到模型要進行數(shù)據(jù)訓練,如果輸入了錯誤數(shù)據(jù),模型就可能會提供不可靠的輸出結(jié)果。當然,也不應該盲目相信人工智能驅(qū)動的分析。
您是否認為監(jiān)督式機器學習可以降低對人工智能輔助圖像分析法的接受障礙?
Lundberg 教授:當然可以。通常,監(jiān)督式機器學習需要對數(shù)據(jù)進行某種標注,而這是我們在成像中已經(jīng)習慣的事情。例如,當用戶想在組織病理學載玻片中標記細胞或標記出感興趣區(qū)域時——這種實況數(shù)據(jù)的生成經(jīng)常會形成瓶頸。只要掌握了數(shù)量足夠的真實情況數(shù)據(jù),就可以訓練出良好的人工智能模型,但仍需要依靠專家來生成這種實況數(shù)據(jù)。真實情況的質(zhì)量反過來又會決定模型的質(zhì)量。我相信,如果實現(xiàn)這個循環(huán)并進行迭代分析,我們可以在專家的指導下訓練出更好的模型,改善模型的薄弱環(huán)節(jié)。這也是一種進步,能夠幫助真正的生物學專家增加對模型的信心,他們可以看到模型如何漸漸得到改進。這種“人在回路"方法是一種意義重大的進步。
您認為圖像分析的未來會如何?
Lundberg 教授:我認為人工智能模型將真正幫助我們理解和挖掘圖像數(shù)據(jù)的所有豐富內(nèi)涵。此外,人工智能還可以幫助我們更智能地制定圖像采集方案,使我們收集到更好的數(shù)據(jù)。人工智能工具將幫助我們超解析、還原和處理圖像,從而生成更快、更智能、更高質(zhì)量的數(shù)據(jù),并且為解釋圖像數(shù)據(jù)和根據(jù)圖像數(shù)據(jù)做出預測等提供新的可能性。
我們還需要克服哪些限制,才能使計算分析方法被廣泛接受?
Lundberg 教授:我認為一個很大的限制是缺乏免費的公共開放圖像存儲庫,以及用于共享顯微成像人工智能模型的模型庫。如果我們可以共享所有針對顯微成像開發(fā)的人工智能模型,并且可以獲取所有已采集的圖像,那么您就可以訓練所有類型的模型,可以研究各種科學問題!
您會對研究人員說些什么來讓他們感興趣并考慮使用人工智能驅(qū)動的分析?
Lundberg 教授:現(xiàn)在的時機很合適——市場上有許多很好的工具,即使不是專家,也可以學習如何使用它們。沒有理由不接受人工智能驅(qū)動的分析方法,因為它可以提供更好的圖像和更好的圖像分析。大多數(shù)顯微鏡工作者在計劃和設置實驗上投入大量時間。那么,為什么不同樣花一些時間采用這種新技術來改進分析呢?
如果想了解人工智能驅(qū)動的圖像分析,有一個非常友好、很有幫助的社群。此外,還有許多關于這個方面的開源工具和論壇,所以沒有理由不去嘗試一下。
目前,在 HPA 數(shù)據(jù)庫中,我們每年擁有大約 1000 萬張圖像和 120 多萬用戶。到目前為止,我們只允許用戶從我們這里下載數(shù)據(jù)。也許,在未來的某個時候,我們能允許用戶上傳自己的圖像數(shù)據(jù),并且除了文字外還能通過圖像查詢我們的數(shù)據(jù)庫。這是個非常切實的目標,我認為人工智能會帶來很多這樣的機會。
了解更多:徠卡顯微
電話
微信掃一掃