新的統計方法緩解數據危機
賓夕法尼亞大學公園-科學研究中一直存在著重現性危機,其中許多研究可能難以或無法復制并因此無法通過驗證,尤其是當研究涉及非常大的樣本量時。例如,要評估高通量遺傳研究結果的有效性,科學家必須能夠復制該研究并獲得相同的結果。現在,賓夕法尼亞州立大學和明尼蘇達大學的研究人員已經開發出一種統計工具,可以準確地估計一項研究的可重復性,從而消除了重復工作的需要,并有效地緩解了重現性危機。
研究小組使用了他們的新方法(他們在今天(3月30日)在《自然通訊》上發表的一篇論文中描述了這一方法,以證實2019年有關導致吸煙和飲酒成癮的遺傳因素的研究的結果,但指出該方法也可以應用其他全基因組關聯研究-或研究疾病的遺傳基礎的研究。
“我們將這種方法用于研究與吸煙和飲酒成癮相關的結果,但它可能會使其他類似的大規模財團研究受益,包括目前有關宿主遺傳對CO-VID-19癥狀的研究,”公共副教授劉大江說。賓夕法尼亞州立大學健康科學與生物化學與分子生物學。
Liu認為,要檢測全基因組關聯研究中的模式,重要的是從大量個體中獲取數據。科學家經常通過結合許多現有的類似設計的研究來獲得這些數據,這是Liu和他的同事在2019年吸煙和飲酒成癮研究中所做的工作,該研究終包括120萬人。
該團隊的方法被稱為MAMBA(基于元分析模型的可復制性評估),用于評估DNA的非典型位(稱為單核苷酸多態性(SNP))與疾病特征(如成癮)之間的關聯的強度和一致性。具體來說,MAMBA計算出如果可以用另一組不同的個體重復進行實驗,則SNP與這些個體特征之間的關系將與第-一個實驗相同或相似。
Liu表示:“我們非常努力地收集了所有可以管理的患者樣本,”他指出這些數據來自生物庫,流行病學研究和直接面向消費者的基因檢測公司,例如23andMe。但是,他補充說,由于該團隊在分析中使用了所有可用的研究,因此沒有剩下的可以用作驗證的比較。他說:“我們的統計方法使研究人員無需復制數據集即可評估遺傳關聯信號的可復制性。”“它有助于大化遺傳研究的力量,因為不需要保留-任何樣本來進行復制;相反,所有樣本都可以用于發現。”
上一篇 : 區分生抽、老抽、蠔油
下一篇 : 研究表明大腦測試預測兒童的未來