GWAS大數據分析過後,要如何證實全基因組與疾病關聯性的掃描結果呢?
通常具有高度疾病關聯性的基因多型性位點會被挑選出來,並使用另一種基因分析技術進行驗證實驗。最好結合QC檢測進行DNA品質監測,才能確保整個實驗結果的精確性,避免出現假陽性的數據。
在統計上,很常利用基因型的補值法(genotype imputation),對缺失的基因型資料補值,再做分析,藉此統整過去不同研究的分析結果,並有效地發掘更多高度疾病關聯性的基因位點。
例如:當控制組的樣本被拿來做其他疾病關聯性的分析,則通常會發生與文獻分析平台或基因位點不一致的狀況,這時候就需要補做控制組的位點分析資料。或是當樣本需要長期追蹤、採集不同時間點的基因資訊,也需要補做位點分析。
雖然分析現有的文獻數據是一個評估全基因組與疾病關聯性的有效方法,但需要留意的是:不同分析技術、晶片數據的差異性,可能會誤導統計結果的真實性。
因此,該如何進一步做更嚴格的數據QC,是驗證階段中的重要課題!
通常在補值前階段 (preimputation stage),會進行下列數據品質管控,剔除較差、較不可信的結果:
- 次等位基因頻率 (minor allele frequency , MAF) ≧1–5%
- 哈溫平衡 (Hardy–Weinberg equilibrium, HWE)的 P-value > 10-4–10-6
- SNP call rate ≧90–99%
- 樣本call rate ≧90–98%
- 其他數據品質檢查,如:性別資料錯誤及不符合孟德爾遺傳學的數據(Mendelian errors)
透過上述數據的篩選,並運用MassARRAY的分析技術,可以快速的針對最具疾病關連性的位點進行大規模的驗證工作。
MassARRAY技術可以支援彈性的客製化設計、整個實驗都不需要”外加螢光標記的primer”,就可以進行multiplex-一個反應但有多重位點的分析,大幅度的降低分析成本。高靈敏度的偵測極限,也讓一些珍貴的樣本、或是品質較差、碎裂化的DNA能成功地進行基因分型實驗。
豐技生技具有MassARRAY 分析服務的原廠認證,並提供專業的實驗諮詢與設計服務。如果有相關研究需求,歡迎來電: (02)2351-9800
或來我們的FB粉專預約實驗諮詢服務:
https://www.facebook.com/FCBioCorp/
參考文獻資料:
“How to deal with the early GWAS data when imputing and combining different arrays is necessary” European Journal of Human Genetics (2012) 20, 572–576
歡迎下載文獻pdf: http://www.tweelingenregister.org/2012/Uh_EJHG_2012.pdf
歡迎閱讀GWAS系列分析文章:
1. 如何從GWAS數據進展到臨床應用?
2. 生資小白也能看懂的GWAS數據篩選重點教學
作者: 林宇馨 / 豐技生技產品專員
留言列表