從中國科大獲悉,該校微尺度物質科學國家研究中心江俊教授與其合作者合作,通過利用人工智能機器學習中的神經網絡技術,模擬了蛋白質肽鍵結構與性質之間的構效關系,大大降低了計算量,為預測蛋白質的光學特性提供了一種高效的工具。相關成果日前發表在《美國科學院院報》上。
蛋白質的光譜響應信號,尤其是紫外光譜,可以稱之為蛋白質骨架的“指紋”。這個“光學指紋”,經過理論模擬的解讀,可以揭示出精確的蛋白質結構,為生命科學和醫學診斷提供極其重要的信息。
然而,蛋白質的結構極其復雜多變,需要做大量的高精度的量子化學理論計算。由于計算量太大,即使是最厲害的超級計算機也“吃不消”。所以蛋白質光譜的理論解讀是一個長期的困難與挑戰,限制了光譜的準確分析和蛋白質結構的發現。
研究人員首先在300K溫度下通過分子動力學模擬以及量子化學計算,得到了五萬組不同構型的肽鍵模型分子。通過機器學習算法篩選出鍵長、鍵角,二面角跟電荷信息作為描述符,通過神經網絡來構建肽鍵基態結構與其激發態性質之間的構效關系。基于訓練好的機器學習模型,預測出了肽鍵的基態偶極矩及激發態性質,最后預測出肽鍵的紫外吸收光譜。為了驗證機器學習模型的魯棒性,研究人員又基于300K的溫度下得到的機器學習模型,預測出肽鍵在200K以及400K溫度下的紫外吸收光譜,其結果與時間密度泛函理論計算結果達到很好的吻合。
這是人工智能技術首次用于理論計算預測蛋白質的光譜研究。通過理論計算得到大量數據,使用人工智能加以訓練后,確立了機器學習模擬蛋白質肽鍵骨架紫外吸收光譜的可行性和優勢,蛋白質的“光學指紋”解讀也將會變得更加輕易和有效。