Sora掘金一本通:AI短視頻原理、提示詞到商業(yè)盈利
定 價:78 元
- 作者:明機 編著
- 出版時間:2024/6/1
- ISBN:9787122453402
- 出 版 社:化學工業(yè)出版社
- 中圖法分類:TN948.4-39
- 頁碼:180
- 紙張:
- 版次:01
- 開本:小16開
如何快速了解Sora文生視頻這一強大模型,制作AI短視頻,搶占市場先機,賺取第一桶金?
本書包括8章專題內(nèi)容布局+73個官方視頻示例分析+490多張圖片全程圖解,隨書還贈送了8大資源:106分鐘同步教學視頻+111頁PPT教學課件+112組AI視頻生成提示詞+119個效果文件+57集AI繪畫教學視頻+56集AI文案寫作教學視頻+15000多組AI繪畫關鍵詞等。具體內(nèi)容從下面兩條線展開。
一條是技能線:從AI短視頻的相關技術入手,介紹Sora的概念特點、基本能力、技術原理、模型架構、生成式AI功能、指令編寫、提示詞庫、商業(yè)變現(xiàn)等內(nèi)容,通過學習和實踐,讀者將能夠充分發(fā)揮Sora的強大功能,創(chuàng)作出令人驚嘆的短視頻作品,實現(xiàn)自己的創(chuàng)作和商業(yè)目標。
一條是案例線:本書非常注重Sora的實際應用,并通過大量的視頻案例分析,包括人像、風光、動物、植物、幻想、旅行等多種題材,同時涉及動畫短片、電影預告片、無人機航拍視頻、歷史鏡頭視頻、電商廣告視頻、游戲視頻等多個領域,全方位展示了Sora在不同場景下的應用效果。
本書是一本不可多得的AI短視頻生成技術指南,適合短視頻創(chuàng)作者、影視制作人員、攝影師、市場營銷人員、AI技術愛好者與開發(fā)者、教育工作者及研究人員等廣大群體閱讀。此外,本書還可以作為相關培訓機構和職業(yè)院校的參考教材。
明機
·AI訓練師:對人工智能三要素算法、算力、算據(jù)(數(shù)據(jù))擁有深厚的研究,熟悉AI算法和模型特性,擅長使用TensorFlow、PyTorch等框架技術進行模型訓練與產(chǎn)品開發(fā);
·AI工程師:對Sora生成連貫視頻序列的循環(huán)神經(jīng)網(wǎng)絡,Sora處理復雜視覺內(nèi)容的空間時間補丁,Sora加快視頻生成速度的自回歸變壓器等技術,Sora成為世界模擬器等技術掌握頗深;
·AI先行者:AI提示詞庫創(chuàng)作者,首批應用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的從業(yè)人員,擅長AI文案編寫、AI繪畫與AI視頻生成訓練。
第1章 認識Sora:強大的人工智能視頻生成模型 1
1.1 Sora是什么 2
1.1.1 Sora的基本介紹 2
【示例1】:走在東京街頭的時尚女性 3
1.1.2 Sora的功能特點 4
【示例2】:穿過東京郊區(qū)的火車窗外的倒影 4
1.1.3 Sora的競品對比 6
【示例3】:坐在天空中的一片云上看書的年輕人 7
1.1.4 Sora的核心優(yōu)勢 9
1.1.5 Sora的創(chuàng)意用途 10
【示例4】:培養(yǎng)皿里的竹林和奔跑的熊貓 11
1.2 面對Sora,我們該思考的5個問題 12
1.2.1 文生視頻模型為什么會火 12
【示例5】:在日落時分愜意地漫步 16
1.2.2 Sora的發(fā)布意味著什么 17
【示例6】:手機鏡頭下的未來城市風貌 18
1.2.3 我們與Sora有何關系 19
【示例7】:“云人閃電”的科幻電影片段 20
1.2.4 我們該如何應對Sora 21
1.2.5 普通人該怎么入局 23
【示例8】:冬日長毛猛犸象的壯麗景色 24
第2章 能力解析:Sora如何高效地生成視頻 26
2.1 Sora的技術創(chuàng)新點 27
2.1.1 支持多樣化視頻格式 27
【示例9】:在大海中游動的海龜 27
2.1.2 改進的畫面構圖和框架 29
【示例10】:兔子和松鼠的奇妙混合物 30
2.1.3 語言理解與視頻生成 31
【示例11】:不同的人物在不同的城市散步 33
2.1.4 多模態(tài)輸入處理 34
【示例12】:無人機環(huán)繞拍攝的海邊建筑 35
2.1.5 可變的持續(xù)時間、分辨率、寬高比 36
【示例13】:白發(fā)男人的特寫鏡頭 37
2.2 Sora強大的視頻生成能力 37
2.2.1 3D一致性:以3D的視角呈現(xiàn)物體和人物的運動 37
【示例14】:推鏡頭展示熙熙攘攘的東京城市街道 38
【示例15】:搖鏡頭展示令人驚嘆的山水風光 39
2.2.2 長期一致性:保持視頻中的人物和場景的不變 40
【示例16】:一只達爾馬提亞狗從窗戶向外看 41
2.2.3 世界交互模擬:模擬人物與環(huán)境之間簡單的互動 42
【示例17】:模擬畫家的創(chuàng)作過程 42
【示例18】:模擬人物吃漢堡的場景 42
2.2.4 模擬數(shù)字世界:探索與創(chuàng)造的無界數(shù)字世界 43
【示例19】:模擬《我的世界》游戲場景 43
2.2.5 復雜元素生成能力:打造出逼真的虛擬場景 44
【示例20】:一大堆老式電視播放著不同的節(jié)目 44
【示例21】:逼真的動畫特寫場景 46
2.2.6 多鏡頭生成能力:呈現(xiàn)出豐富的視覺盛宴 46
【示例22】:用不同的鏡頭展示的機器人 47
2.3 Sora面臨的一些局限性和挑戰(zhàn) 48
2.3.1 模擬物理世界的局限性 48
【示例23】:破碎的玻璃杯 49
2.3.2 生成長視頻的難度 50
【示例24】:在沙漠中發(fā)現(xiàn)的塑料椅子 50
【示例25】:籃球通過籃筐后爆炸 51
2.3.3 理解復雜提示詞的準確性 52
【示例26】:慶祝生日的溫馨家庭場景 53
2.3.4 訓練模型的復雜性 54
【示例27】:35毫米電影風格的跑步動作場景 55
2.3.5 提升視頻生成的時效性 56
【示例28】:偏僻路上小狼嬉戲的場景 57
第3章 技術原理:解析Sora的技術特性與優(yōu)勢 59
3.1 解析Sora的技術原理 60
3.1.1 Sora如何根據(jù)文本生成內(nèi)容——Diffusion模型 60
3.1.2 Sora如何處理復雜視覺內(nèi)容——時間空間補丁 62
3.1.3 Sora如何生成連貫的視頻序列——循環(huán)神經(jīng)網(wǎng)絡 63
【示例29】:中國農(nóng)歷新年慶祝視頻 64
3.1.4 Sora如何生成不同風格的視頻——生成對抗網(wǎng)絡 65
3.1.5 Sora如何加快視頻的生成速度——自回歸變換器 67
3.2 Sora在視頻生成過程中的3個關鍵步驟 68
3.2.1 步驟1:視頻壓縮網(wǎng)絡 68
【示例30】:一窩金毛尋回犬在雪地里玩耍 68
3.2.2 步驟2:時間空間潛在補丁提取 69
3.2.3 步驟3:視頻生成的Transformer模型 70
【示例31】:淘金熱期間加利福尼亞州的歷史錄像 70
3.3 Sora技術的未來展望 71
3.3.1 技術革新與性能升級:速度更快、穩(wěn)定性更強、體驗更流暢 71
3.3.2 跨領域融合與拓展應用:讓生活更加多姿多彩、充滿無限可能 72
第4章 模型架構:Sora的基礎是世界通用模型 73
4.1 認識世界通用模型 74
4.1.1 什么是世界通用模型 74
4.1.2 世界通用模型的作用是什么 75
【示例32】:Santorini的航拍建筑美景 76
4.1.3 多模態(tài)模型促進AI更好地理解真實世界 77
【示例33】:一列蒸汽火車行駛在高架橋上 78
4.1.4 世界通用模型打破了虛擬與現(xiàn)實的邊界 79
【示例34】:愜意漫步的南非婦女 79
4.1.5 世界通用模型的代表——Runway 80
4.2 Sora將視頻生成模型作為世界模擬器 81
4.2.1 用大語言模型的方法理解視頻 81
【示例35】:一群紙飛機在茂密的叢林中飛舞 82
【示例36】:愉快漫步的老人 83
【示例37】:白雪皚皚的東京城 84
4.2.2 實現(xiàn)對物理世界的“涌現(xiàn)” 85
【示例38】:可愛的達爾馬提亞狗 85
4.2.3 模擬真實物理世界的運動 87
【示例39】:壯觀的海岸風光 88
4.3 Sora模型訓練的核心技術 90
4.3.1 自然語言理解 90
4.3.2 生成式人工智能模型 92
【示例40】:老年人的悠閑生活與美麗的自然風光 93
4.3.3 場景構建與精細化渲染 96
4.3.4 AI驅(qū)動的動畫技術 98
【示例41】:眨眼的特寫鏡頭 99
4.3.5 個性化定制與持續(xù)優(yōu)化 100
【示例42】:不同風格的袋鼠漫步場景 101
第5章 功能詳解:使用Sora快速生成視頻 105
5.1 Sora的文生視頻功能 106
5.1.1 Sora的注冊方法 106
5.1.2 申請Sora的內(nèi)測資格 110
5.1.3 使用文生視頻功能 113
5.2 Sora的其他AI生成功能 114
5.2.1 圖生視頻:為DALL·E圖像制作動畫 114
【示例43】:活潑可愛的柴犬 115
【示例44】:一個多樣化的怪物家族 116
【示例45】:由字母組成的云朵圖片 117
【示例46】:沖浪者在歷史大廳中駕馭巨浪 118
5.2.2 視頻生視頻:向前或向后擴展視頻的時長 119
【示例47】:舊金山的高空城市纜車 119
【示例48】:永無止境的騎行場景 122
5.2.3 視頻到視頻編輯:轉換視頻的風格和環(huán)境 123
【示例49】:飛馳在叢林中的跑車 123
5.2.4 連接視頻功能:創(chuàng)建神奇的無縫過渡效果 125
【示例50】:無人機視頻與蝴蝶視頻的連接 126
【示例51】:越野車視頻與豹子視頻的連接 128
5.2.5 圖像生成功能:為用戶帶來卓越的體驗 130
第6章 指令編寫:優(yōu)化提示詞提升Sora的生成效果 133
6.1 編寫Sora提示詞的基礎思路 134
6.1.1 明確具體的視頻元素 134
【示例52】:一只在拍攝視頻的柯基犬 134
6.1.2 詳細描述場景細節(jié) 135
【示例53】:一朵花生長的定格動畫 135
6.1.3 創(chuàng)造性地使用提示詞 136
【示例54】:一群魚在紐約的街道上游動 136
6.1.4 構思引人入勝的角色和情節(jié) 137
【示例55】:一只貓叫醒正在睡覺的主人 137
6.1.5 用逐步引導的方式構建提示詞 139
【示例56】:擠滿了工人的建筑工地 139
6.2 Sora提示詞的編寫技巧 140
6.2.1 如何選擇Sora的提示詞 140
【示例57】:基納巴丹干河上的野生動物 141
6.2.2 Sora提示詞的編寫順序 142
【示例58】:美術館內(nèi)的藝術盛宴 143
6.2.3 編寫Sora提示詞的注意事項 143
【示例59】:跳迪斯科舞的卡通袋鼠 144
第7章 提示詞庫:打造專業(yè)級視頻效果必備的要素 145
7.1 Sora內(nèi)容型提示詞 146
7.1.1 主體特征 146
【示例60】:在南極洲愉快漫步的女人 147
【示例61】:不同主體特征的視頻效果 148
7.1.2 場景特征 150
【示例62】:色彩斑斕的魚類和海洋生物 151
7.1.3 藝術風格 152
【示例63】:太空冒險故事的電影預告片 153
7.2 Sora標準化提示詞 155
7.2.1 畫面構圖 155
【示例64】:變色龍的特寫鏡頭 156
7.2.2 視線角度 157
【示例65】:維多利亞冠鴿的側面視角 158
7.2.3 畫面景別 159
【示例66】:玻璃球體里的小矮人 160
7.2.4 色彩色調(diào) 161
【示例67】:在茂密的花園里奔跑的虎斑貓 162
7.2.5 環(huán)境光線 163
【示例68】:月光下的狼嚎剪影動畫 164
【示例69】:在霓虹燈城市中嬉戲的小狗 165
7.2.6 鏡頭參數(shù) 165
【示例70】:深海中的大章魚和帝王蟹之戰(zhàn) 166
第8章 商業(yè)變現(xiàn):從文本到視頻的創(chuàng)收之路 168
8.1 Sora未來可能的商業(yè)場景應用 169
8.1.1 電商產(chǎn)品展示 169
8.1.2 視頻廣告制作 170
8.1.3 游戲開發(fā)和動畫片制作 170
【示例71】:展示游戲《我的世界》 171
【示例72】:水獺的熱帶沖浪冒險 172
8.1.4 電影電視節(jié)目制作 173
【示例73】:海盜船激戰(zhàn)瞬間 173
8.1.5 教育內(nèi)容制作 174
8.2 如何利用Sora實現(xiàn)多渠道變現(xiàn) 174
8.2.1 廣告收入與贊助變現(xiàn) 175
8.2.2 知識付費變現(xiàn) 175
8.2.3 提示詞交易變現(xiàn) 176
8.2.4 內(nèi)容創(chuàng)作變現(xiàn) 177
8.2.5 Sora的其他變現(xiàn)方式 178