凡是和數(shù)據(jù)相關(guān)的專業(yè)和領(lǐng)域,一定是近幾年全球最炙手可熱的。在沒有基礎(chǔ)和沒有任何項目經(jīng)驗的情況下,如何才能成功升級打怪呢?參加一段超高含金量的kaggle學(xué)術(shù)活動項目一定為你的申請留學(xué)、轉(zhuǎn)專業(yè)、求職和轉(zhuǎn)行加分不少!
今天就帶大家來看看即刻可以報名的一場Kaggle學(xué)術(shù)活動及賽題解析!
比賽名稱:Novozymes Enzyme Stability Prediction
幫助識別酶中的熱穩(wěn)定突變
比賽類型:自然語言處理、生物醫(yī)學(xué)
比賽背景酶是在生物體的化學(xué)反應(yīng)中充當(dāng)催化劑的蛋白質(zhì)。本次比賽的目標(biāo)是預(yù)測酶變體的熱穩(wěn)定性。實(shí)驗測量的熱穩(wěn)定性(熔化溫度)數(shù)據(jù)包括天然序列,以及在天然序列上具有單個或多個突變的工程序列。
了解和準(zhǔn)確預(yù)測蛋白質(zhì)穩(wěn)定性是生物技術(shù)中的一個基本問題。它的應(yīng)用包括酶工程,用于解決世界在可持續(xù)性、碳中和等方面的挑戰(zhàn)。提高酶穩(wěn)定性可以降低成本并提高科學(xué)家迭代概念的速度。語境
許多酶只是勉強(qiáng)穩(wěn)定,這限制了它們在惡劣應(yīng)用條件下的性能。不穩(wěn)定性也會降低細(xì)胞可產(chǎn)生的蛋白質(zhì)量。因此,開發(fā)預(yù)測蛋白質(zhì)穩(wěn)定性的有效計算方法具有巨大的技術(shù)和科學(xué)意義。
比賽任務(wù)在本次比賽中,Novozymes 邀請您開發(fā)一個模型,根據(jù)實(shí)驗熔解溫度數(shù)據(jù)預(yù)測/排序酶變體的熱穩(wěn)定性,該數(shù)據(jù)來自 Novozymes 的高通量篩選實(shí)驗室。
如果成功,您將幫助解決提高蛋白質(zhì)穩(wěn)定性的基本問題,使設(shè)計新穎和有用的蛋白質(zhì)(如酶和治療劑)的方法更快、成本更低。
評價指標(biāo)提交的內(nèi)容根據(jù)基本事實(shí)與預(yù)測之間的 Spearman 相關(guān)系數(shù)進(jìn)行評估。
每個 seq_id 代表一種酶的單突變變體。你的任務(wù)是對這些變體的穩(wěn)定性進(jìn)行排名,為更穩(wěn)定的變體分配更高的排名。
數(shù)據(jù)描述在本次比賽中,您被要求開發(fā)可以預(yù)測單點(diǎn)氨基酸突變和缺失后蛋白質(zhì)穩(wěn)定性(通過熔點(diǎn),tm 測量)排名的模型。
對于訓(xùn)練集,蛋白質(zhì)穩(wěn)定性(實(shí)驗解鏈溫度)數(shù)據(jù)包括自然序列,以及在自然序列上具有單個或多個突變的工程序列。數(shù)據(jù)主要來自不同來源的已發(fā)表研究。
測試集包含超過 2,413 個酶的單突變變體(GenBank:KOC15878.1)的實(shí)驗熔解溫度,由 Novozymes A/S 獲得。
比賽賽程
2022年12月27日:報名截止日期。您必須在此日期之前接受比賽規(guī)則才能參加比賽。
2022年12月27日:團(tuán)隊合并截止日期。這是參與者加入或合并團(tuán)隊的最后一天。
2023年1月3日:最終提交截止日期。
賽題獎金????
1st?Place?-?$?12,000
2nd Place - $ 8,000
3rd Place - $ 5,000
比賽鏈接:https://www.kaggle.com/competitions/novozymes-enzyme-stability-prediction/
解題思路賽題是一個典型的醫(yī)學(xué)蛋白質(zhì)預(yù)測的比賽,任務(wù)可以抽象為回歸任務(wù)。建議可以參考也有學(xué)術(shù)模型。
kaggle含金量
掃碼獲取備賽計劃,考前查缺補(bǔ)漏、重點(diǎn)沖刺
免費(fèi)領(lǐng)取相關(guān)真題及解析,還有一對一學(xué)術(shù)活動規(guī)劃!

文章大部分內(nèi)容轉(zhuǎn)載自公眾號【Coggle數(shù)據(jù)科學(xué)】,版權(quán)歸原作者所有,本文僅做分享,如有侵權(quán)請聯(lián)系刪除。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1