關(guān)于我們
書單推薦
新書推薦
|
生物學家必備大數(shù)據(jù)實用計算技巧 讀者對象:該書適合生物信息學、基因組學、分子醫(yī)學、進化生物學等學科的教師、研究生、本科生作為入門教材閱讀,也可供相關(guān)學科的科研人員和教師參考。
面對生物數(shù)據(jù)的急速增長,對大數(shù)據(jù)的分析處理能力是生物學家普遍缺乏又急需掌握的能力。《生物學家必備大數(shù)據(jù)實用計算技巧》是在作者開發(fā)計算工具和幫助許多生物學家解決計算問題時總結(jié)經(jīng)驗的基礎(chǔ)上誕生的,是針對生物學家撰寫的簡明實用教程,它將一系列強大而靈活的實用工具匯集到一起,容易學習入門。《生物學家必備大數(shù)據(jù)實用計算技巧》內(nèi)容以分子生物信息學數(shù)據(jù)為主,但也適用于多種其他生物數(shù)據(jù)的分析工作。《生物學家必備大數(shù)據(jù)實用計算技巧》原版問世至今,一直是歐美高校生物專業(yè)和相關(guān)研究機構(gòu)必備的熱銷圖書。
更多科學出版社服務(wù),請掃碼獲取。
目錄
在開始之前 1 引言 1 為什么要寫這本書? 1 為什么只針對生物學家? 2 需要使用特定計算機或程序嗎? 2 寫給使用這本書自學的讀者 3 寫給使用這本書的教師 3 超越這本書 4 如何使用好這本書 4 第一部分 文 本 文 件 第1章 開始設(shè)置 9 關(guān)于文本文件的操作介紹 9 什么是文本文件 9 在一個文本文件內(nèi)組織數(shù)據(jù) 10 文本編輯器 11 安裝TextWrangler 11 在文本編輯器里優(yōu)化文本外觀 12 行尾結(jié)束符 13 示例文件 13 安裝示例文件 14 探索示例文件 14 總結(jié) 15 第2章 正則表達式:強大的搜索和替換 16 一種用于搜索和替換的廣泛語言 16 了解這個新工具箱的組件 17 設(shè)置文本編輯器 17 你的第一個通配符:\w 代替字母和數(shù)字 19 用()來捕獲文本 20 量詞:用+來對應(yīng)一個或多個實體 21 用\進行標點符號字符轉(zhuǎn)義 23 更為特殊的搜索項:\s\t\r\d 24 示例:分子數(shù)據(jù)文件的重新格式化 25 關(guān)于生成正則表達式的評論 26 總結(jié) 27 第3章 探索正則表達式的靈活性 28 字符集:定義你自己的通配符 28 用[]定義定制的字符集 28 應(yīng)用自定義字符集 28 否定字符集:用[^]定義自定義字符集 30 邊界:^開頭和$結(jié)尾 31 使量詞更加精密 32 另一個量詞:*為零次或多次 32 用?修改貪婪程度 33 用{}符號控制匹配的數(shù)量 33 把所有都放在一起 34 生成替換關(guān)鍵詞 35 構(gòu)建可靠的搜索 36 總結(jié) 37 進一步學習 38 第二部分Shell命令 第4章 命令行操作:shell 41 初次接觸:不要懼怕命令行 41 開始了解shell然后產(chǎn)生興趣 42 開始了解shell 42 文件系統(tǒng)的命令行視圖 43 路徑 44 利用shell在計算機里遨游 45 用ls列出文件,用pwd 找出你在哪里 45 如何用cd來回移動位置 47 用~表示主目錄 48 用mkdir和rmdir來添加和移除文件夾 49 復制文件 49 移動文件 51 命令行快捷鍵 51 向上箭頭鍵 51 Tab 52 用命令行參數(shù)來修正命令的行為 53 用less命令瀏覽文件內(nèi)容 54 在命令行中使用man命令查看幫助文件 55 命令行最終會使你的操作更容易 55 路徑描述中的通配符 55 復制和移動多個文件 56 結(jié)束你的終端會話 57 總結(jié) 57 推薦閱讀 58 第5章 在shell中處理文本 59 用nano在命令行里編輯文本文件 59 控制shell里的數(shù)據(jù)流 61 用>重定向輸出到一個文件 61 用cat來顯示和連接文件 62 用grep在命令行中使用正則表達式 64 處理一個大數(shù)據(jù)集 64 從文件中抽提特定的行 64 用管道|將輸出從一個程序重定向到另一個程序 66 用grep跨越搜索多個文件 67 改善grep的行為 68 用curl 獲取Web 上的內(nèi)容 69 其他shell命令 71 總結(jié) 72 第6章 使用shell 編寫腳本 73 組合命令 73 搜索路徑 73 命令行如何找到它應(yīng)執(zhí)行的命令 73 創(chuàng)建你的工作區(qū)—腳本文件夾 75 編輯你的bash_profile文件來進行個性化設(shè)置 76 檢查你的新$PATH 77 把文本文檔型文件轉(zhuǎn)變?yōu)檐浖?78 #!控制腳本文本用何種程序解釋 79 通過調(diào)整權(quán)限使文本文件可以被執(zhí)行 79 生成自動腳本 81 批量復制文件 81 靈活的文件重命名 84 運用curl自動檢索參考文獻 86 用curl編寫腳本的幾個常用方法 88 用Alias創(chuàng)建快捷別名 88 總結(jié) 89 進一步學習 89 第三部分 編 程 第7章 編程組件 93 程序是什么? 93 接下來幾章的目標 93 實際編程 94 變量 95 變量的剖析 95 基本變量類型 96 能夠容納其他變量的變量 97 數(shù)組和列表 97 不同類型之間的轉(zhuǎn)換 99 運行中的變量 99 數(shù)學運算符 99 比較運算符與邏輯運算符 100 函數(shù) 101 流控制 102 用if語句做決策 102 由for與while構(gòu)成的循環(huán) 103 使用列表和字典 104 列表 104 字典 105 其他數(shù)據(jù)類型 105 輸入和輸出 106 用戶交互 106 文件 106 庫和模塊 107 注釋語句 108 對象 108 總結(jié) 109 第8章 開始使用Python編程 110 為什么選擇Python110 編寫程序 111 開始運行程序 111 構(gòu)建dnacalcpy 程序 112 簡單的print 語句 112 len()函數(shù) 114 使用str()、int()和float()轉(zhuǎn)換變量類型 115 內(nèi)置字符串函數(shù)count() 116 整數(shù)和浮點數(shù)的數(shù)學運算 116 使用#添加評論 118 使用%運算符控制字符串格式 118 獲取用戶輸入 120 使用raw_input()收集用戶輸入 120 用replace()和upper()整理變量 121 回顧你的程序 123 總結(jié) 123 第9章 決策與循環(huán) 124 Python交互式提示符 124 獲取Python的幫助 126 向dnacalcpy里添加更多的計算內(nèi)容 127 if條件語句 127 使用縮進指定代碼塊 128 邏輯運算符 128 if語句 129 else:語句 130 for循環(huán)介紹 132 列表簡介 132 在proteincalcpy中寫入for 循環(huán) 133 創(chuàng)建字典 133 其他字典函數(shù) 139 應(yīng)用你學會的循環(huán)技能 140 回顧列表 140 列表的索引 141 從列表中解包多個值 143 用range()函數(shù)定義一個列表 143 列表和字符串的比較 145 列表和字符串之間轉(zhuǎn)換 146 向列表中添加元素 147 從列表中刪除元素 148 查找列表的內(nèi)容 148 給列表排序 148 識別列表及字符串中獨有的元素 149 列表推導式 150 總結(jié) 152 進一步學習 153 第10章 讀取與寫入文件 154 目標概述 154 從文件中逐條讀取每一行內(nèi)容 156 讀取數(shù)據(jù)文件之前的注意事項 156 打開并讀取文本文件 157 用strip()刪除行尾字符 159 跳過標題行 159 從行中解析數(shù)據(jù) 160 將行拆分為數(shù)據(jù)字段 160 從列表中選擇元素 161 寫入文件 162 扼要重述文件的基本讀寫過程 164 使用正則表達式解析值 165 導入re模塊 165 通過re模塊使用正則表達式 165 research()與resub()的使用總結(jié) 167 使用def創(chuàng)建自定義Python函數(shù) 168 用新格式打包數(shù)據(jù) 173 檢查標記語言 173 在轉(zhuǎn)換期間保留信息 174 轉(zhuǎn)換為KML格式 174 KML文件格式 174 生成KML文本 175 總結(jié) 179 進一步學習 179 第11章 合并文件 180 從多個文件中讀取數(shù)據(jù) 180 使用sysargv 獲取用戶的輸入內(nèi)容 181 將所有參數(shù)轉(zhuǎn)換為文件列表 183 使用sysstderrwrite()提供反饋 184 循環(huán)遍歷文件列表 185 打印輸出并生成標題行 187 避免硬編碼軟件 187 文件讀取的其他應(yīng)用 190 總結(jié) 192 進一步學習 192 第12章 模塊與庫 194 導入模塊 194 更多來自標準庫的內(nèi)置模塊 196 urllib模塊 196 os模塊 197 math模塊 197 random模塊 198 time模塊 199 第三方模塊 200 NumPy 201 BioPython202 其他第三方模塊 203 制作自己的模塊 204 繼續(xù)深入學習Python 205 總結(jié) 206 進一步學習 206 第13章 調(diào)試策略 207 在調(diào)試中學習 207 通用策略 208 建立工作元素 208 思考你的假設(shè) 208 具體的調(diào)試技術(shù) 209 隔離問題 209 編寫冗長的軟件 210 錯誤信息及其含義 211 常見的Python錯誤 211 shell錯誤 212 讓你的程序更有效率 212 優(yōu)化 212 使用try和except來處理錯誤 213 當你實在被困住時 214 總結(jié) 215 進一步學習 215 第四部分 多種方法合并 第14章 選擇和組合工具 219 你的工具箱 219 數(shù)據(jù)處理任務(wù)的類別 219 獲取數(shù)字數(shù)據(jù) 219 重新格式化文本文件 222 綜合考慮 226 總結(jié) 226 進一步學習 226 第15章 關(guān)系型數(shù)據(jù)庫 227 電子表格和數(shù)據(jù)組織 227 數(shù)據(jù)管理系統(tǒng) 229 剖析一個數(shù)據(jù)庫 230 安裝MySQL 231 開始使用MySQL和SQL 233 連接到命令行中的MySQL服務(wù)器 233 創(chuàng)建數(shù)據(jù)庫和表 235 向表中添加數(shù)據(jù)行和顯示表的內(nèi)容 239 在Python中與MySQL進行交互 240 解析輸入的文本 241 從數(shù)據(jù)中構(gòu)造SQL 243 從Python中執(zhí)行SQL命令 244 將文本文件導入到表格中 249 創(chuàng)建ctd表 250 用LOAD DATA命令導入數(shù)據(jù)文件 251 以SQL文件的形式導出和導入數(shù)據(jù)庫 253 用SQL探索數(shù)據(jù) 253 用SELECT和COUNT命令匯總表 253 用GROUP BY校對數(shù)據(jù) 255 SQL中的數(shù)學運算 256 用WHERE對行進行精確選擇 256 用UPDATE修改行 259 跨表選擇數(shù)據(jù) 260 使用Python生成輸出 262 繼續(xù)向前看 264 數(shù)據(jù)庫用戶和安全性 264 創(chuàng)建一個root密碼 265 添加一個新的MySQL用戶 265 總結(jié) 266 進一步學習 267 推薦閱讀 267 第16章 高級的shell和管道命令 268 其他有用的shell 命令 268 用head和tail提取行 268 用cut提取列 268 用sort對行排序 270 用uniq分離出獨有的行 271 高級shell函數(shù)的整合 272 用agrep進行近似搜索 275 額外的grep技巧 276 還記得別名嗎? 277 函數(shù) 278 用戶輸入的函數(shù) 281 一個字典函數(shù) 281 轉(zhuǎn)換字符 281 循環(huán)遍歷傳遞給函數(shù)的所有參數(shù) 282 刪除文件擴展名 283 尋找文件 284 回顧管道命令 284 用循環(huán)重復操作 285 封裝器 286 對管道的一些想法 287 總結(jié) 287 推薦閱讀 288 第五部分 繪圖 第17章 圖像的概念 291 引言 291 常用的圖像類型 291 矢量圖與像素圖 291 決定何時用矢量圖?何時用像素圖?或是二者都用? 292 圖片分辨率與尺寸大小 294 圖像大小調(diào)整和對DPI 的錯誤看法 295 圖片的顏色 297 顏色模型和色空間 297 顏色模型的轉(zhuǎn)換 298 色域與顏色配置文件 300 顏色選擇 300 決策過程總結(jié) 301 圖層 303 展示數(shù)據(jù)時通常需要考慮的因素 303 消除圖像的混亂 303 對于重疊數(shù)據(jù)的透明化處理 304 合理利用空間 304 一致性 306 保持數(shù)據(jù)的完整性 306 為什么你應(yīng)該避免使用PowerPoint幻燈片 307 總結(jié) 307 進一步學習 308 推薦閱讀 308 第18章 矢量圖的編輯和使用 310 矢量圖簡介及原理 310 文件格式 310 生成矢量圖 310 從另一個程序輸出圖像 311 繪制一幅新的圖像 311 從一張照片中提取圖像 312 解析矢量圖 313 貝塞爾曲線 313 線型與填充 313 矢量圖編輯器的使用 314 選定并操作整個對象 314 選定并操作對象的一部分 315 利用鋼筆工具生成貝塞爾曲線 316 對貝塞爾曲線進行修飾 316 聯(lián)結(jié)功能 317 線條與填充 317 圖層 318 Illustrator使用小貼士 319 Inkscape使用小貼士 321 一個典型的工作流程 321 生成規(guī)則排列的對象 323 生成矢量圖的最佳實踐 324 總結(jié) 325 進一步學習 325 第19章 使用像素圖 326 圖像壓縮 326 通用原則 326 圖像工作流的含義 326 像素圖文件格式 327 透明度 328 像素圖編輯器 329 處理像素圖 329 遮罩和無損編輯 329 亮度水平的調(diào)整 329 灰度圖像 330 抗鋸齒 331 圖層 331 GIMP的色彩 332 Photoshop快捷鍵 332 圖像處理的命令行工具 333 sips程序 333 ImageMagick:convert和mogrify命令 333 ExifTool 334 圖像創(chuàng)建和分析工具 334 ImageJ 334 MATLAB 336 R 336 動畫制作 336 攝影 337 光圈和曝光時間 337 色彩平衡 339 自動vs手動操作 340 總結(jié) 340 進一步學習 340 第六部分 高級話題 第20章 在遠程計算機上操作任務(wù) 343 連接到遠程計算機 343 客戶端和服務(wù)器 343 典型的遠程訪問情景 344 查找計算機:IP地址、主機名和DNS 344 安全性 346 使用ssh的安全命令行連接 346 ssh命令 347 ssh命令使用時的故障排除 347 在遠程機器上操作 348 計算機之間的文件傳輸 349 文件歸檔和壓縮 349 用sftp傳送文件 350 用scp復制文件 350 SFTP中其他的文件傳輸程序 351 其他的文件傳輸協(xié)議 351 通過VNC對遠程計算機進行完全GUI控制 351 排除遠程連接障礙 352 使用虛擬專用網(wǎng)絡(luò)(VPN)連接到本地 352 用traceroute命令追蹤網(wǎng)絡(luò)連接 353 配置backspace鍵 353 控制程序如何運行 354 結(jié)束進程 354 用&在后臺開始任務(wù) 355 用ps和top命令來查看任務(wù)狀態(tài) 355 暫停任務(wù)并把它移至后臺 357 用kill命令來結(jié)束進程 358 用nohup命令使任務(wù)繼續(xù)進行 359 用renice命令更改程序的優(yōu)先級 360 高效計算 361 并行程序 361 大型計算機集群上的任務(wù)管理工具 361 搭建自己的服務(wù)器 362 配置ssh服務(wù)器 363 查找地址 363 用ssh 連接到你自己的計算機 364 總結(jié) 365 第21章 軟件安裝 366 概述 366 解釋程序與編譯程序 367 安裝軟件的方法 368 Readmetxt和Installtxt 368 通過預編譯的二進制文件安裝程序 368 自動安裝工具 369 從源代碼安裝命令行程序 370 準備好你的計算機 370 解壓源代碼 370 編譯與安裝二進制文件 371 變化情況1:現(xiàn)成的Makefile 372 變化情況2:用/configure生成Makefile文件 372 安裝Python組件 373 故障排除 374 軟件無法編譯或安裝無法完成怎么辦? 374 總結(jié) 376 進一步學習 376 第22章 電子學:與物理世界的互動 377 生物學中定制的電子產(chǎn)品 377 生物學中定制電子產(chǎn)品的典型情景 377 具有復雜微控制器的簡單電路 378 電子基礎(chǔ) 380 電流 380 基本元件 380 用電信號編碼信息 381 模擬編碼 381 數(shù)字編碼信號 382 搭建電路 383 電路原理圖 383 實驗面包板 384 從電路原理圖翻譯成面包板電路 385 串行通信的實踐應(yīng)用 385 波特率和其他設(shè)置 386 零調(diào)制解調(diào)器 386 串行通信的軟件 387 通過Python進行串行通信 388 Arduino微控制器板的實踐應(yīng)用 389 從哪里開始 389 用Arduino搭建電路 389 編程Arduino 390 其他數(shù)據(jù)采集的方法 393 常見的共同疑惑問題 394 測量電壓 394 電流和電子流 394 上拉和下拉電阻 395 總結(jié) 395 進一步學習 396 推薦讀物 396 附錄 附錄1 用其他操作系統(tǒng)工作 399 Microsoft Windows 399 我應(yīng)該用Windows還是另外安裝Linux? 399 在第1~3章中用于編輯文本和正則表達式的文本編輯器 399 在第4~6章中使用Cygwin模擬Unix shell操作 401 第8~12章中在Windows里使用Python402 第15章中在Windows里使用MySQL 404 第17~19章中在Windows里處理矢量圖和像素圖 404 Linux 405 安裝Linux 405 在第1~3章中用jEdit進行文本編輯和使用正則表達式 409 在第4~6章中使用Linux shell進行shell操作 410 第8~12章中在Linux上使用Python 411 第15章使用MySQL 411 第17~19章在Linux中處理矢量圖和像素圖 411 附錄2 正則表達式檢索項 412 附錄3 shell命令 414 附錄4 Python快速參考 419 此附錄的規(guī)定 419 Python中的格式、語法和標點符號 419 命令行解釋器 419 命令總結(jié) 420 變量類型和統(tǒng)計 420 字符串 420 收集用戶輸入 421 建立字符串 421 比較和邏輯運算符 421 數(shù)學運算符 422 決策 422 循環(huán) 423 用正則表達式檢索 423 用regexp在字符中尋找匹配子集 423 用regexp在字符串中做替換 424 使用列表 424 列表的理解 425 詞典 426 創(chuàng)建函數(shù) 426 處理文件 427 使用模塊和函數(shù) 428 容易混淆的Python操作 429 顯示警告和反饋 429 捕捉錯誤 429 Python里的shell操作 429 參考及尋求幫助的渠道 429 附錄5 程序模板 430 Python27或更早的版本 430 Python3 431 Perl 431 bash shell 431 C 432 C++ 433 Java 433 JavaScript 434 PHP 435 Ruby 435 MATLAB 436 R 436 Arduino 437 附錄6 二進制、十六進制和ACSII碼 438 交替的基本系統(tǒng) 438 十六進制 439 ASCII 碼和Unicode字符 440 圖像和色彩 441 十進制、十六進制、二進制和ASCII 碼 442 附錄7 SQL命令 446
你還可能感興趣
我要評論
|