定 價:39 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:李文平
- 出版時間:2021/2/1
- ISBN:9787111672371
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:156
- 紙張:
- 版次:1
- 開本:16K
本書是一本為人文社會科學方向的老師和學生量身打造的Python入門書。大數(shù)據(jù)時代人文社會科學的研究者應該充分利用數(shù)據(jù)資源,分析數(shù)據(jù)背后隱藏的一般規(guī)律和特征。
本書以解決語言研究中常見的問題為主線,涉及中、英、日三種語言。以具體的問題為導向,講解快速、高效處理這些問題的方法,對每種方法都配有全部代碼及其詳細說明。將這些代碼與第10章的批處理方法相結(jié)合,可以大大提高工作效率及準確性。本書每章都配有習題,便于加深理解和應用拓展。
本書適合作為自學Python的參考書,亦可作為語料庫語言學、計量語言學、計量風格學等課程的教材。
目 錄
前 言
第1篇 準備工作與文本
第1章 語言研究與編程3
1.1 學習編程的理由3
1.1.1 大數(shù)據(jù)語言研究3
1.1.2 新增功能4
1.1.3 注意事項5
1.2 編程難點6
1.3 本書構成6
1.3.1 內(nèi)容構成6
1.3.2 樣本文件和相關軟件6
1.4 本章小結(jié)6
習題6
第2章 文本數(shù)據(jù)7
2.1 文本文件的優(yōu)點7
2.2 文本文件的使用8
2.2.1 文本編輯器8
2.2.2 文本編輯器的安裝8
2.2.3 單文本檢索9
2.2.4 多文本檢索11
2.2.5 文本編輯器替換實例12
2.3 字符編碼與換行編碼13
2.3.1 字符編碼13
2.3.2 字符編碼的判斷13
2.3.3 字符編碼的轉(zhuǎn)換15
2.3.4 換行編碼15
2.4 本章小結(jié)16
習題16
第3章 正則表達式17
3.1 正則表達式的定義17
3.2 文本查找17
3.2.1 符號“?”的用法18
3.2.2 符號“.”的用法18
3.2.3 符號“+”的用法20
3.2.4 符號“*”的用法20
3.2.5 符號“[ ]”的用法20
3.2.6 符號“|”的用法22
3.2.7 符號“^”與“$”的用法23
3.2.8 后方引用23
3.2.9 元字符組合24
3.3 文本替換25
3.4 本章小結(jié)28
習題28
第2篇 Python的基礎知識
第4章 Python入門31
4.1 選擇Python的理由31
4.2 Python的安裝31
4.3 Python的運行33
4.4 Python的計算34
4.4.1 Python的計算器功能34
4.4.2 變量34
4.5 字符串35
4.5.1 字符串顯示36
4.5.2 字符串長度:len( )函數(shù)37
4.5.3 數(shù)值與字符串37
4.5.4 數(shù)值轉(zhuǎn)字符串:str( )函數(shù)38
4.5.5 字符串轉(zhuǎn)數(shù)值:int( )函數(shù)38
4.6 本章小結(jié)39
習題39
第5章 使用Python讀取文件40
5.1 保存并運行Python程序40
5.1.1 程序編寫41
5.1.2 準備工作41
5.1.3 程序運行43
5.1.4 錯誤處理43
5.2 添加注釋45
5.3 結(jié)果保存46
5.4 程序分析46
5.5 本章小結(jié)47
習題48
第6章 Python的檢索49
6.1 if語句49
6.2 字符串語句51
6.2.1 運算符in51
6.2.2 startswith( )函數(shù)與endswith( )
函數(shù)51
6.3 not,and,or52
6.3.1 否定:not52
6.3.2 與關系:and52
6.3.3 或關系:or53
6.4 else與elif53
6.5 if實例54
6.5.1 特定行輸出54
6.5.2 字母大小寫55
6.5.3 刪除空行56
6.6 本章小結(jié)56
習題56
第7章 for循環(huán)58
7.1 循環(huán)的基礎知識58
7.2 循環(huán)控制語句60
7.2.1 跳過當前循環(huán):continue60
7.2.2 循環(huán)中止:break61
7.3 循環(huán)應用62
7.3.1 添加行號62
7.3.2 部分文件的輸出63
7.3.3 關鍵詞標記64
7.3.4 空標記65
7.4 本章小結(jié)66
習題66
第8章 單詞一覽表:列表68
8.1 列表68
8.1.1 列表的索引與切片69
8.1.2 列表元素的添加70
8.1.3 列表排序71
8.2 列表與循環(huán)72
8.3 文件排序73
8.4 單詞一覽表74
8.4.1 字符串與列表轉(zhuǎn)換:split( )和
join( )74
8.4.2 單詞一覽表程序75
8.4.3 符號處理77
8.5 表格數(shù)據(jù)處理77
8.6 本章小結(jié)80
習題80
第9章 單詞頻度表:字典81
9.1 字典的基礎知識81
9.2 單詞頻度表83
9.3 頻度表排序85
9.4 字典的導入86
9.5 本章小結(jié)88
習題88
第10章 文件操作89
10.1 文件的輸入與輸出89
10.1.1 操作對象89
10.1.2 文件的輸出91
10.1.3 關鍵詞91
10.2 批處理92
10.2.1 文件一覽表92
10.2.2 文件內(nèi)容的輸出93
10.2.3 文件名的輸出94
10.2.4 文件檢索95
10.2.5 文件替換95
10.3 本章小結(jié)97
習題97
第11章 Python中的正則
表達式98
11.1 正則表達式檢索98
11.1.1 匹配99
11.1.2 匹配行輸出99
11.1.3 匹配單詞統(tǒng)計100
11.1.4 匹配單詞列表102
11.2 替換102
11.3 本章小結(jié)103
習題103
第3篇 Python應用:以漢語文本為中心
第12章 漢語詞性標注基礎及
常用工具107
12.1 漢語詞性標注107
12.2 漢語詞性標注工具108
12.2.1 NLPIR108
12.2.2 Python jieba110
12.3 本章小結(jié)112
習題112
第13章 日語形態(tài)素解析工具113
13.1 形態(tài)素解析113
13.2 形態(tài)素解析工具簡介114
13.2.1 軟件下載114
13.2.2 軟件安裝115
13.3 形態(tài)素解析工具的使用方法118
13.3.1 數(shù)據(jù)的選擇119
13.3.2 輸出選項120
13.4 形態(tài)素解析的注意事項123
13.4.1 解析精度123
13.4.2 解析單位124
13.5 本章小結(jié)125
習題126
第14章 Python處理漢語文本127
14.1 文本的讀寫127
14.2 漢語單詞頻度表128
14.3 動詞頻度表132
14.4 本章小結(jié)134
習題134
第15章 KWIC檢索135
15.1 KWIC135
15.2 KWIC檢索程序136
15.2.1 讀入數(shù)據(jù)136
15.2.2 range( )函數(shù)138
15.2.3 前后語境140
15.2.4 KWIC檢索程序代碼141
15.3 本章小結(jié)143
習題143
第16章 詞語搭配檢索144
16.1 詞語搭配檢索程序144
16.2 程序的改進147
16.2.1 批處理148
16.2.2 復雜匹配150
16.3 程序的拓展154
16.3.1 語境范圍154
16.3.2 檢索條件155
16.4 本章小結(jié)155
習題155
參考文獻156