美國(guó)麻省理工學(xué)院和哈佛大學(xué)博德研究所最新開發(fā)出一種名為FLSHclust的新算法,在數(shù)十億個(gè)蛋白質(zhì)序列中發(fā)現(xiàn)了188個(gè)罕見且以前未知的CRISPR連接基因模塊,其中包括新的VII型CRISPR-Cas系統(tǒng)。新發(fā)現(xiàn)為利用CRISPR系統(tǒng)和了解微生物蛋白質(zhì)的功能多樣性提供了新機(jī)會(huì)。
CRISPR系統(tǒng)已被用來(lái)開發(fā)越來(lái)越多的新型生物分子方法,包括著名的CRISPR/Cas介導(dǎo)的基因組編輯。而此前未知的CRISPR系統(tǒng)的出現(xiàn),將推動(dòng)這些生物技術(shù)進(jìn)一步發(fā)展。
不過,盡管CRISPR工具箱已通過蛋白質(zhì)序列數(shù)據(jù)庫(kù)得到擴(kuò)展。但常用的算法在挖掘包含數(shù)十億蛋白質(zhì)呈指數(shù)增長(zhǎng)的數(shù)據(jù)集時(shí),顯得不切實(shí)際。
為了解決這一限制,研究團(tuán)隊(duì)開發(fā)了FLSHclust算法,這是一種通過序列相似性對(duì)蛋白質(zhì)進(jìn)行聚類的算法,與目前可用的方法不同,它能快速有效地分析大量蛋白質(zhì)序列數(shù)據(jù)庫(kù)。
利用新算法,團(tuán)隊(duì)在包含80億個(gè)蛋白質(zhì)和1020萬(wàn)個(gè)CRISPR陣列的宏基因組數(shù)據(jù)庫(kù)中搜索罕見的CRISPR系統(tǒng),發(fā)現(xiàn)了188個(gè)以前未知的CRISPR相關(guān)基因,同時(shí)鑒定并表征了一類新的包含CRISPR系統(tǒng)的Cas-14(即VII型),其作用于RNA。
此次新發(fā)現(xiàn)的系統(tǒng)十分罕見。研究人員表示,這種先前未知的Cas基因和CRISPR系統(tǒng)的發(fā)現(xiàn),極大地?cái)U(kuò)展了CRISPR的多樣性,揭示了CRISPR系統(tǒng)前所未有的組織和功能的靈活性與模塊化,同時(shí)也表明大多數(shù)變異都是罕見的。
【總編輯圈點(diǎn)】
近年來(lái),CRISPR-Cas9基因編輯技術(shù)在生命科學(xué)等領(lǐng)域得到迅速推廣和應(yīng)用。它成本低廉,簡(jiǎn)單易用,成為科學(xué)家做生物學(xué)實(shí)驗(yàn)的得力助手。不僅如此,該技術(shù)本身也成為生命科學(xué)領(lǐng)域備受關(guān)注的熱門研究課題。需要指出的是,盡管CRISPR-Cas9基因編輯技術(shù)非常好用,但它并不完美。因此,發(fā)現(xiàn)更多的CRISPR-Cas系統(tǒng),豐富了基因編輯技術(shù)“工具箱”,為生命科學(xué)研究提供了更多選擇,同時(shí)也有望促進(jìn)基因編輯技術(shù)繼續(xù)迭代升級(jí)。
科技日?qǐng)?bào)北京11月26日電(記者張夢(mèng)然)