關(guān)于我們
書單推薦
新書推薦
|
視覺:對(duì)人類如何表示和處理視覺信息的計(jì)算研究 讀者對(duì)象:本書可供計(jì)算機(jī)科學(xué)、人工智能、計(jì)算機(jī)視覺等相關(guān)專業(yè)的研究人員、研究生及高年級(jí)本科生等學(xué)習(xí)使用或作為研究參考。
本書研究了人類對(duì)視覺信息的表示和處理,并對(duì)視覺計(jì)算處理過(guò)程提出了全面的計(jì)算理論。全書立足于計(jì)算機(jī)科學(xué)的進(jìn)展,是跨學(xué)科交叉研究的經(jīng)典教科書,并對(duì)多個(gè)學(xué)科的研究都有深刻啟發(fā)作用。特別值得一提的是,在近年深度學(xué)習(xí)的熱潮之中,了解掌握本書介紹的視覺計(jì)算理論對(duì)于在人工智能和計(jì)算機(jī)視覺領(lǐng)域內(nèi)開展進(jìn)一步探索是至關(guān)重要的。
David Courtnay Marr是計(jì)算神經(jīng)科學(xué)領(lǐng)域的創(chuàng)始人之一,曾任麻省理工學(xué)院心理學(xué)教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科學(xué)研究所的計(jì)算機(jī)科學(xué)Samy和Ruth Cohn講席教授。Tomaso Poggio是麻省理工學(xué)院腦和認(rèn)知科學(xué)系的Eugene McDermott講席教授。Ullman和Poggio都曾在麻省理工學(xué)院與David Marr共事。
吳佳俊,斯坦福大學(xué)計(jì)算機(jī)科學(xué)系助理教授,研究方向是計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和計(jì)算認(rèn)知科學(xué)。 加入斯坦福大學(xué)之前,曾是谷歌研究院的訪問研究員,并分別在清華大學(xué)和麻省理工學(xué)院獲得了學(xué)士和博士學(xué)位。 他的研究曾獲ACM博士學(xué)位論文榮譽(yù)提名獎(jiǎng)、AAAI/ACM SIGAI博士學(xué)位論文獎(jiǎng)、麻省理工學(xué)院George M. Sprowls人工智能與決策博士學(xué)位論文獎(jiǎng),以及2020年三星人工智能年度研究人員獎(jiǎng)。
第Ⅰ部分 引言和哲學(xué)基礎(chǔ)
總述........................................................................................................................... 3 第1章 哲學(xué)原理和方法.......................................................................................... 7 1.1 背景知識(shí) ...................................................................................................... 7 1.2 理解復(fù)雜的信息處理系統(tǒng)......................................................................... 16 表示和描述 ................................................................................................ 16 處理............................................................................................................ 17 信息處理的三個(gè)層次 ................................................................................ 19 計(jì)算理論的重要性 .................................................................................... 21 J. J. Gibson 的方法..................................................................................... 22 1.3 視覺的表示框架 ........................................................................................ 24 視覺的目的 ................................................................................................ 25 高級(jí)視覺 .................................................................................................... 26 目標(biāo)與可行性 ............................................................................................ 28 第Ⅱ部分 視覺 第 2 章 圖像的表示............................................................................................... 33 2.1 早期視覺的物理背景................................................................................. 33 圖像的表示 ................................................................................................ 35 基本物理假設(shè) ............................................................................................ 35 圖像表示的一般性質(zhì) ................................................................................ 40 2.2 過(guò)零點(diǎn)和原初草圖..................................................................................... 42 過(guò)零點(diǎn)........................................................................................................ 42 生物學(xué)的意義 ............................................................................................ 48 原初草圖 .................................................................................................... 54 哲學(xué)私語(yǔ) .................................................................................................... 59 2.3 圖像的空間排布 ........................................................................................ 62 2.4 光源和透明度 ............................................................................................ 68 其他光源效果 ............................................................................................ 70 透明度........................................................................................................ 70 結(jié)論............................................................................................................ 71 2.5 聚合過(guò)程和全初草圖................................................................................. 71 主要論點(diǎn) .................................................................................................... 75 紋理辨別的計(jì)算方法及其心理物理學(xué)意義............................................. 76 第 3 章 從圖像到表面 ........................................................................................... 78 3.1 人類視覺處理的模塊化組織..................................................................... 78 3.2 圖像的處理、約束和可用表示................................................................. 81 3.3 立體視覺 .................................................................................................... 87 測(cè)量立體視差 ............................................................................................ 87 從視差中計(jì)算距離和表面朝向 .............................................................. 121 3.4 方向選擇性 .............................................................................................. 124 視覺運(yùn)動(dòng)引言 .......................................................................................... 124 利用方向選擇性來(lái)分離獨(dú)立運(yùn)動(dòng)的表面............................................... 136 漸進(jìn).......................................................................................................... 141 3.5 似動(dòng) .......................................................................................................... 141 為什么要研究似動(dòng) .................................................................................. 142 把問題一分為二 ...................................................................................... 143 對(duì)應(yīng)問題 .................................................................................................. 146 從運(yùn)動(dòng)中恢復(fù)結(jié)構(gòu) .................................................................................. 158 光流.......................................................................................................... 164 3.6 形狀輪廓 .................................................................................................. 166 一些例子 .................................................................................................. 167 遮擋輪廓 .................................................................................................. 168 表面朝向的不連續(xù) .................................................................................. 173 表面輪廓 .................................................................................................. 175 3.7 表面紋理 .................................................................................................. 180 分離紋理元素 .......................................................................................... 180 小結(jié).......................................................................................................... 184 3.8 明暗和光度立體視覺............................................................................... 184 梯度空間 .................................................................................................. 185 表面光照、表面反射和圖像強(qiáng)度 .......................................................... 188 反射率圖 .................................................................................................. 189 從明暗中恢復(fù)形狀 .................................................................................. 191 光度立體視覺 .......................................................................................... 192 3.9 明度、亮度和色彩................................................................................... 194 Helson-Judd 方法..................................................................................... 195 關(guān)于亮度和色彩的視網(wǎng)膜—皮層理論................................................... 196 同時(shí)對(duì)比的重要性的物理依據(jù) .............................................................. 200 對(duì)強(qiáng)度非線性變化的表層起源的假設(shè)................................................... 202 測(cè)量三色圖像的意義 .............................................................................. 203 本方法小結(jié) .............................................................................................. 204 3.10 本章小結(jié) ................................................................................................ 205 第 4 章 可見表面的直接表示............................................................................... 208 4.1 引言 .......................................................................................................... 208 4.2 圖像分割 .................................................................................................. 209 4.3 對(duì)問題的重新建模................................................................................... 211 4.4 需要表示的信息 ...................................................................................... 213 4.5 2.5 維草圖的一般形式............................................................................. 215 4.6 表示的可能形式 ...................................................................................... 216 4.7 可能的坐標(biāo)系 .......................................................................................... 220 4.8 插值、延續(xù)性和不連續(xù)性....................................................................... 221 4.9 插值問題的計(jì)算 ...................................................................................... 224 不連續(xù)...................................................................................................... 224 插值方法 .................................................................................................. 226 4.10 其他內(nèi)部計(jì)算 ........................................................................................ 228 第 5 章 用于識(shí)別的形狀表示............................................................................... 230 5.1 引言 .......................................................................................................... 230 5.2 形狀表示引起的問題............................................................................... 231 評(píng)判形狀表示的有效性的標(biāo)準(zhǔn) .............................................................. 232 形狀表示的設(shè)計(jì)選擇 .............................................................................. 233 5.3 三維模型表示 .......................................................................................... 235 自然坐標(biāo)系 .............................................................................................. 236 基于坐標(biāo)軸的描述 .................................................................................. 236 三維模型表示的模塊化組織 .................................................................. 237 三維模型的坐標(biāo)系 .................................................................................. 239 5.4 自然推廣 .................................................................................................. 241 5.5 推導(dǎo)和使用三維模型表示....................................................................... 244 三維模型描述的推導(dǎo) .............................................................................. 244 以觀察者為中心的坐標(biāo)系和以物體為中心的坐標(biāo)系的關(guān)系............... 247 三維模型的索引和目錄 .......................................................................... 247 推導(dǎo)和識(shí)別的交互 .................................................................................. 250 5.6 心理學(xué)的考量 .......................................................................................... 253 第 6 章 總結(jié)........................................................................................................ 256 第Ⅲ部分 尾聲 第 7 章 對(duì)計(jì)算方法的辯護(hù) .................................................................................. 261 7.1 引言 .......................................................................................................... 261 7.2 一段對(duì)話 .................................................................................................. 261 原書第 2 版后記 Marr 的《視覺》和計(jì)算神經(jīng)科學(xué)............................................. 284 中文版后記 從 Marr 的《視覺》到人類智能問題................................................ 288 術(shù)語(yǔ)表................................................................................................................... 292 參考文獻(xiàn) ............................................................................................................... 298
你還可能感興趣
我要評(píng)論
|