目錄
前言
1 深度測序技術(shù)與生物信息學(xué) 1
1.1 深度測序的常用平臺 1
1.1.1 Illumina測序系統(tǒng) 1
1.1.2 Roche 454測序儀 5
1.1.3 Applied Biosystems SOLiD測序儀 7
1.1.4 PacBio RSII單分子測序 8
1.1.5 Ion PGM和Proton半導(dǎo)體測序儀 8
1.2 深度測序技術(shù)對生物醫(yī)學(xué)研究和社會的影響 9
1.2.1 生物醫(yī)學(xué)大數(shù)據(jù)與生物醫(yī)學(xué)研究范式的改變 9
1.2.2 深度測序技術(shù)對經(jīng)濟市場的影響 10
1.2.3 深度測序技術(shù)對社會的影響 11
1.3 深度測序數(shù)據(jù)處理的挑戰(zhàn) 12
1.3.1 數(shù)據(jù)存取方面的挑戰(zhàn) 12
1.3.2 計算技術(shù)方面的挑戰(zhàn) 13
1.3.3 數(shù)據(jù)應(yīng)用方面的挑戰(zhàn) 14
1.3.4 人才缺失與跨學(xué)科人才教育的挑戰(zhàn) 15
1.4 常見的軟件和分析平臺介紹 15
1.4.1 生物信息學(xué)雜志特刊中的軟件及其分類 15
1.4.2 R與Bioconductor軟件平臺 16
參考文獻 17
2 深度測序相關(guān)數(shù)據(jù)庫和數(shù)據(jù)格式 19
2.1 深度測序相關(guān)的數(shù)據(jù)庫 19
2.2 深度測序相關(guān)的數(shù)據(jù)格式 22
2.2.1 序列與質(zhì)量分數(shù)相關(guān)格式 22
2.2.2 序列比對的相關(guān)格式 24
2.2.3 序列組裝的相關(guān)格式 24
2.2.4 突變的相關(guān)格式 25
2.2.5 序列注釋及可視化的相關(guān)格式 25
2.3 格式轉(zhuǎn)換 27
2.3.1 數(shù)據(jù)格式轉(zhuǎn)換軟件NGSFormatConverter 27
2.3.2 NGSFormatConverter的安裝與應(yīng)用 29
參考文獻 30
3 堿基識別 32
3.1 深度測序堿基識別簡介 32
3.2 Illumina平臺堿基識別軟件 33
參考文獻 36
4 基因組序列比對 37
4.1 短序列片段比對軟件的發(fā)展 37
4.1.1 深度測序技術(shù)帶來的機遇 37
4.1.2 深度測序數(shù)據(jù)帶來的比對定位瓶頸 37
4.2 深度測序片段比對軟件的比較 39
4.2.1 深度測序片段比對軟件 39
4.2.2 深度測序片段比對定位軟件算法比較 40
4.2.3 比對定位軟件性能比較 45
4.2.4 比對定位軟件評價 47
4.3 深度測序片段比對軟件實例演示 50
4.4 展望 51
參考文獻 53
5 小片段序列組裝 55
5.1 問題闡述:小片段序列組裝 55
5.1.1 小片段組裝類型 55
5.1.2 當前組裝過程的挑戰(zhàn) 56
5.1.3 小片段組裝過程的意義 56
5.2 組裝策略:如何將小片段組裝成重疊群 58
5.2.1 基因組序列的組裝 58
5.2.2 轉(zhuǎn)錄組序列的組裝 63
5.3 算法評價:如何選取一個合適的組裝軟件 63
5.3.1 基因組組裝軟件的選擇 64
5.3.2 轉(zhuǎn)錄組組裝軟件的選擇 66
5.4 程序示例:如何執(zhí)行一個片段組裝過程 67
5.4.1 基因組測序數(shù)據(jù)的組裝 67
5.4.2 轉(zhuǎn)錄組測序數(shù)據(jù)的組裝 69
5.5 總結(jié)和展望:組裝算法何去何從 70
參考文獻 71
6 染色質(zhì)免疫共沉淀測序數(shù)據(jù)分析 73
6.1 ChIP-Seq簡介 73
6.1.1 ChIP-Seq的出現(xiàn) 73
6.1.2 ChIP-Seq的基本實驗流程 75
6.1.3 影響ChIP-Seq實驗成功的因素 76
6.2 ChIP-Seq數(shù)據(jù)計算分析 77
6.2.1 堿基識別 77
6.2.2 定位到基因組 78
6.2.3 富集區(qū)域的鑒定 78
6.2.4 其他下游分析 80
6.3 Peak Calling算法比較 81
6.4 ChIP-Seq數(shù)據(jù)分析應(yīng)用實例 84
6.4.1 峰的尋找 84
6.4.2 基因關(guān)聯(lián) 86
6.4.3 Motif發(fā)現(xiàn) 87
6.4.4 注釋分析 87
6.4.5 可視化 88
6.5 ChIP-Seq軟件的改進和發(fā)展方向 89
參考文獻 91
7 轉(zhuǎn)錄組測序數(shù)據(jù)分析 93
7.1 RNA-Seq簡介 93
7.2 RNA-Seq技術(shù)的應(yīng)用 96
7.3 RNA-Seq數(shù)據(jù)處理與軟件 97
7.3.1 概述 97
7.3.2 剪接位點預(yù)測軟件 98
7.3.3 基因表達水平分析軟件 101
7.3.4 綜合性分析軟件 102
7.4 軟件安裝與使用 105
7.4.1 選擇性剪接軟件 105
7.4.2 基因表達水平分析軟件 110
7.4.3 綜合性分析軟件 111
7.5 展望 118
參考文獻 119
8 microRNA-Seq數(shù)據(jù)分析 121
8.1 microRNA簡介 121
8.2 深度測序與microRNA-Seq技術(shù) 122
8.2.1 概述 122
8.2.2 microRNA-Seq實驗流程 123
8.2.3 microRNA-Seq數(shù)據(jù)處理 123
8.3 microRNA-Seq數(shù)據(jù)分析軟件 125
8.3.1 概述 125
8.3.2 本地分析軟件 126
8.3.3 在線分析軟件 138
8.4 軟件性能比較 146
8.4.1 測試數(shù)據(jù)與環(huán)境配置 146
8.4.2 運行時間比較 147
8.4.3 敏感度與準確度比較 147
8.4.4 新的miRNA預(yù)測 148
參考文獻 149
9 變異檢測 151
9.1 引言 151
9.2 基因組多態(tài)性 153
9.3 變異的類型及其檢測 157
9.3.1 SNP 157
9.3.2 結(jié)構(gòu)變異 159
9.4 變異檢測軟件實例 166
9.4.1 Genome Analysis Toolkit簡介 166
9.4.2 Genome Analysis Toolkit安裝 166
9.4.3 Genome Analysis Toolkit使用 168
9.5 展望 171
參考文獻 172
10 單細胞測序數(shù)據(jù)分析 176
10.1 單細胞測序技術(shù)的簡要發(fā)展歷程 176
10.2 單細胞測序的技術(shù)實現(xiàn)及主要分類 177
10.2.1 常用單細胞分離的技術(shù) 178
10.2.2 單細胞基因組測序技術(shù) 179
10.2.3 單細胞轉(zhuǎn)錄組測序技術(shù) 180
10.2.4 單細胞表觀遺傳組測序技術(shù) 181
10.3 單細胞測序的技術(shù)應(yīng)用 181
10.3.1 單細胞測序技術(shù)在癌癥生物中的應(yīng)用 182
10.3.2 單細胞測序技術(shù)在發(fā)育生物中的應(yīng)用 182
10.3.3 單細胞測序技術(shù)在微生物學(xué)研究中的應(yīng)用 183
10.3.4 單細胞測序技術(shù)的臨床應(yīng)用前景 183
10.4 單細胞測序技術(shù)的數(shù)據(jù)分析實例 183
10.4.1 輸入數(shù)據(jù)以及數(shù)據(jù)分析工具介紹 184
10.4.2 數(shù)據(jù)的讀入與歸一化 184
10.4.3 根據(jù)歸一化后的數(shù)據(jù)鑒定樣本中高度差異表達的基因 184
10.5 單細胞測序技術(shù)的未來發(fā)展趨勢 185
參考文獻 186
11 深度測序的數(shù)據(jù)可視化軟件 188
11.1 數(shù)據(jù)可視化技術(shù)的生物問題和應(yīng)用背景 188
11.1.1 生物問題 188
11.1.2 應(yīng)用背景 188
11.2 數(shù)據(jù)可視化相關(guān)軟件介紹和比較 189
11.2.1 基于網(wǎng)絡(luò)的可視化瀏覽器 190
11.2.2 基于本地平臺的可視化軟件 191
11.3 軟件示例 197
11.3.1 Savant安裝 197
11.3.2 Savant運行實例 198
參考文獻 205