生物資訊的大數據分析發展至今,許多疾病的全基因組關聯分析(genome-wide association study, GWAS)也進入到了post-GWAS時代。相關資料庫、分析套件以及統計方法也越來越精緻,有許多生資人員開發了人性化操作介面與分析軟體,可以讓一般研究員後續在處理數據時,能更得心應手。
您的實驗室還有塵封已久的GWAS數據不知從何下手嗎?
趕快閱讀這篇文章,一同解開GWAS分析到後續應用的神秘面紗!
讓我們一起勇敢面對大數據,並從中篩選出有用的資料,開始進行驗證實驗吧!
從NGS大數據到開發應用的過程中,我們大致可分為四大階段,分別為:
- 分組收案
- GWAS數據篩選
- 大規模分組驗證
- 開發應用或功能性分析
其中,GWAS數據分析是整個基因關聯性實驗中,非常重要且充滿挑戰性的一個環節!
這四大階段去蕪存菁的流程到底如何進行? 讓我們繼續看下去…
一、確定分析主題及動機後,再進行樣本的分組蒐集
在打算進行全基因組分析前,首先必須搞懂實驗主題、分析對象,以及實驗組、對照組。且最好搜尋一下GWAS資料庫(ex. GWAS Catalog),決定分析的檢體量,如果已經有許多類似族群的樣本數據,就不用再花大筆的經費重複分析啦!
最好對整個實驗設計有全盤了解後,再一同進行GWAS分析,否則如果有哪個變因遺漏了,又要補data,真的是很麻煩的一件事情,而且也可能因此拉高分析成本,研究經費得來不易,要花在刀口上啊!
當然,分組完畢後萃取完DNA樣本時,記得做好DNA樣本品管,避免因為樣本品質問題導致NGS上機失敗喔!
歡迎複習品管文章的精華懶人包:
二、從GWAS大數據找出候選基因以及可能的風險變異
GWAS分析的強大之處,就是能在族群中無偏差的識別SNP、重複序列以及功能性變異位點。然而,定序資料這麼多,到底要如何撈出重要的關聯性區域呢?
這個階段的分析與篩選是影響後續實驗成功與否的重要關鍵,主要可以拆分為三大步驟。在這裡先簡單列出小標題,如果想知道各個步驟的詳細分析介紹,歡迎收看”生資小白也能看懂的GWAS數據篩選重點教學”一文。
- 從GWAS 資料庫找出疾病關聯性基因座
- 位點篩選: 生物統計學filter篩選、計算生物學生資分析、資料庫比對、相關文獻搜尋、位點多樣性篩選
- 思考故事要怎麼說? 基因關聯性分析
三、大規模分組validation,統計顯著差異以及變異發生率
在完成GWAS位點篩選後,就可以開始進行更大規模的樣本收案與分組,並針對這些可能有高度關聯性的位點進行基因型驗證的動作。
這部分的分析技術包含了QPCR、MassARRAY等適合驗證的技術平台。
若目標位點數少於5個,則一般常見的QPCR技術可以快速又便宜的解決驗證實驗。
但如果位點數偏多,且樣本數量也達到上百、甚至上千個樣本,則MassARRAY會是大規模樣本及多位點驗證的最佳選項。在"GWAS分析的下一步:如何分組驗證疾病關聯性?" 這篇文章中,會進一步針對樣本挑選、SNP挑選以及驗證實驗方法做更詳細的說明。
因為MassARRAY具有multiplex的分析優勢,遺傳性分析一個反應最多可進行40個位點的驗證,一次實驗、一個反應的樣本分析所需DNA只需10 ng左右,十分節省樣本、分析成本以及人力成本。
(若對這個技術有興趣,歡迎收看先前的MassARRAY分析原理文章)
四、功能性分析實驗探討致病機轉
驗證完畢後,可以再次檢察數據是否真的具有顯著差異。並開始著手進行各種功能性分析實驗,包括臨床檢測的試劑開發、利用細胞實驗或動物實驗進行致病機轉的深入研究……等。
看完上述介紹,各位是否對Big data>Validation>Application 這整個分析過程有更親切的感覺了呢?
豐技生技公司主力為提供Validation階段的實驗及分析服務,另外也有提供較小資料量的NGS實驗服務,如果有相關研究需求,歡迎來電洽詢: (02)23519800,或是在我們的FB粉絲專頁預約線上實驗討論與諮詢喔!
參考資料:
1. Curr Rheumatol Rep. 2019 Jan 23;21(1):3. doi: 10.1007/s11926-019-0801-5.
歡迎閱讀其他核酸品管文章:
1. 核酸品質-決定基因檢測的可信度及資料豐度!
2. 如何評估DNA樣本的品質?-核酸定量檢測
3. 如何評估DNA樣本的完整性?-核酸定性檢測
歡迎閱讀GWAS分析系列文章:
1. 生資小白也能看懂的GWAS數據篩選重點教學
2. GWAS分析的下一步:如何分組驗證疾病關聯性?
作者: 林宇馨 / 豐技生技產品專員
留言列表