作者知名:軒轅大模型負(fù)責(zé)人:真正的大語言模型實踐者,擁有十億、百億、千億等不同參數(shù)規(guī)模大語言模型的訓(xùn)練經(jīng)驗
系統(tǒng)性強(qiáng):從數(shù)據(jù)處理的基礎(chǔ)工作(如數(shù)據(jù)清洗與去重)講起,逐步深入,探討預(yù)訓(xùn)練、微調(diào)技術(shù)和強(qiáng)化對齊技術(shù)等核心技術(shù)環(huán)節(jié)。同時,書中對大語言模型評估策略及其應(yīng)用技術(shù)架構(gòu),包括推理引導(dǎo)技術(shù)和動態(tài)交互技術(shù),進(jìn)行了全面且深入的探討,確保讀者能夠從理論和技術(shù)角度全面理解大語言模型。
實踐性強(qiáng):精心設(shè)計了從零開始的教學(xué)章節(jié),提供大語言模型微調(diào)的詳細(xì)指導(dǎo),逐步引領(lǐng)讀者掌握關(guān)鍵技能。
本書不僅有助于初學(xué)者迅速上手,也為有經(jīng)驗的開發(fā)者提供了深入學(xué)習(xí)的機(jī)會
全彩印刷
緣起:為什么要寫這本書
OpenAI的ChatGPT自推出以來,迅速成為人工智能領(lǐng)域的焦點(diǎn)。ChatGPT在語言理解、生成、規(guī)劃及記憶等多個維度展示了強(qiáng)大的能力。這不僅體現(xiàn)在對特定任務(wù)的高效處理上,更重要的是,它在處理多樣化任務(wù)和復(fù)雜場景中的靈活性顯著,甚至能在一定程度上模擬人類的思考方式。這種能力的展現(xiàn),標(biāo)志著人工智能從專注于單一任務(wù)的傳統(tǒng)模型向通用人工智能轉(zhuǎn)變,其強(qiáng)大的能力將對千行百業(yè)產(chǎn)生深遠(yuǎn)影響,尤其在優(yōu)化業(yè)務(wù)流程和重塑組織結(jié)構(gòu)方面。
然而,在研究和實踐過程中,我們遇到了一個主要挑戰(zhàn):市場上缺乏大語言模型在實際應(yīng)用方面的資料,F(xiàn)有的資料多聚焦于理論研究,而具體的實踐方法多被保密,難以獲得實際操作的指導(dǎo)。為了填補(bǔ)這一空白,我們歷經(jīng)一年的實踐和探索,決定分享我們的經(jīng)驗和成果,旨在為大語言模型的初學(xué)者和實踐者提供快速入門和應(yīng)用的途徑。
為應(yīng)對技術(shù)的快速演進(jìn)和信息的日新月異,我們建立了一個GitHub社區(qū),用于持續(xù)更新我們的技術(shù)成果和見解。我們期望通過這種方式,促進(jìn)讀者對大語言模型的深入理解和廣泛應(yīng)用,推動整個領(lǐng)域的持續(xù)發(fā)展和創(chuàng)新。
本書特色
本書旨在揭開大語言模型的神秘面紗,透徹地解讀其內(nèi)在機(jī)理和應(yīng)用實踐。書中不僅介紹理論知識,更介紹了深入這一技術(shù)領(lǐng)域的具體訓(xùn)練過程,目的是為讀者提供一個全面、深入且系統(tǒng)化的視角,以揭示大語言模型的精妙之處。
本書的一大特色體現(xiàn)在其知識體系的系統(tǒng)性。我們從數(shù)據(jù)處理的基礎(chǔ)工作(如數(shù)據(jù)清洗與去重)講起,逐步深入,探討預(yù)訓(xùn)練、微調(diào)技術(shù)和強(qiáng)化對齊技術(shù)等核心技術(shù)環(huán)節(jié)。同時,書中對大語言模型評估策略及其應(yīng)用技術(shù)架構(gòu),包括推理引導(dǎo)技術(shù)和動態(tài)交互技術(shù),進(jìn)行了全面且深入的探討,確保讀者能夠從理論和技術(shù)角度全面理解大語言模型。
本書的另一大特色是對實踐性的重視。我們精心設(shè)計了從零開始的教學(xué)章節(jié),提供大語言模型微調(diào)的詳細(xì)指導(dǎo),逐步引領(lǐng)讀者掌握關(guān)鍵技能。這不僅有助于初學(xué)者迅速上手,也為有經(jīng)驗的開發(fā)者提供了深入學(xué)習(xí)的機(jī)會。
作為真正的大語言模型實踐者,我們擁有十億、百億、千億等不同參數(shù)規(guī)模大語言模型的訓(xùn)練經(jīng)驗。在本書中,這些經(jīng)驗都被毫無保留地融入其中,確保本書內(nèi)容的實用性和深度。
本書是理論與實踐經(jīng)驗的精華,干貨滿滿,絕非空談。
本書結(jié)構(gòu)
本書共10章,下面是各章的主要內(nèi)容概述。
第1章:解鎖大語言模型
本章勾勒大語言模型的全貌,并介紹大語言模型的基礎(chǔ)概念。
第2章:大語言模型基礎(chǔ)技術(shù)
本章旨在深度解析構(gòu)成大語言模型的基礎(chǔ)知識和核心技術(shù)。先回顧自然語言的基礎(chǔ)表示方法,為理解復(fù)雜模型奠定基礎(chǔ);再詳盡地探討自然語言處理中的預(yù)訓(xùn)練架構(gòu)Transformer,以揭示其內(nèi)在工作機(jī)制;接著介紹如BERT和GPT這樣的標(biāo)桿性預(yù)訓(xùn)練模型;最后以InstructGPT和LLaMA系列為例,為讀者呈現(xiàn)大語言模型的初步實用成果。
第3章:預(yù)訓(xùn)練數(shù)據(jù)構(gòu)建
本章將深入探討預(yù)訓(xùn)練數(shù)據(jù)的常見類別、來源和預(yù)處理方式,以及構(gòu)建訓(xùn)練數(shù)據(jù)的重點(diǎn)和難點(diǎn)。
第4章:大語言模型預(yù)訓(xùn)練
本章將深入探討大語言模型預(yù)訓(xùn)練的各個方面。首先解析不同的大語言模型架構(gòu)和不同模塊的選擇;同時對大語言模型的訓(xùn)練過程進(jìn)行介紹,包括數(shù)據(jù)選擇和配比策略、模型訓(xùn)練等。
第5章:挖掘大語言模型潛能:有監(jiān)督微調(diào)
本章將從定義、用途和應(yīng)用場景3個方面解釋有監(jiān)督微調(diào);同時講解如何構(gòu)建有針對性的微調(diào)數(shù)據(jù),以及大語言模型微調(diào)的各種技巧。
第6章:大語言模型強(qiáng)化對齊
本章先介紹強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識、兩類主流深度強(qiáng)化學(xué)習(xí)算法,重點(diǎn)介紹大語言模型中基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)技術(shù),然后介紹強(qiáng)化學(xué)習(xí)常用的訓(xùn)練框架和平臺,以及RLHF實踐過程中的常見問題;最后介紹RLHF中的難點(diǎn)及目前存在的問題,對RLHF將來可能的技術(shù)發(fā)展做進(jìn)一步展望。
第7章:大語言模型的評測
本章首先介紹大語言模型的評測,如基座模型的評測方式等。然后重點(diǎn)講解微調(diào)之后具有對話能力的模型的評測方式,包括SFT階段全維度的對話能力評測和 RLHF 階段模型以安全性為主的能力評測。最后探討如何評價一個通用人工智能。
第8章:大語言模型的應(yīng)用
本章將展示提示詞技術(shù)對大語言模型的引導(dǎo)能力。首先從最簡單的零樣本提示開始介紹,這些技術(shù)使大語言模型擁有逐步推理的能力。然后介紹搜索增強(qiáng)生成技術(shù)、推理和行動協(xié)同技術(shù),利用這兩個技術(shù),大語言模型可以獲得在與環(huán)境的交互中逐步分解并解決問題的能力。
第9章:工程實踐
本章將深入探討大語言模型從訓(xùn)練到完成任務(wù)的各個環(huán)節(jié)所涉及的工程優(yōu)化技術(shù)和相關(guān)實踐案例。這些技術(shù)和實踐旨在提高模型的效率、性能和可擴(kuò)展性,從而滿足實際應(yīng)用中的需求。
第10章:手把手教你訓(xùn)練7B大語言模型
本章將介紹微調(diào)大語言模型的關(guān)鍵步驟和代碼示例,以便更直接地應(yīng)用這些技術(shù)。
通過閱讀本書,讀者可以獲得全面且深入的大型語言模型的知識框架。無論您是研究人員、工程師,還是產(chǎn)品經(jīng)理,都能從中獲得有價值的知識。大語言模型已經(jīng)在各個領(lǐng)域展現(xiàn)出了巨大的潛力,本書將幫您更好地掌握和應(yīng)用這一技術(shù)。
說明
本書包含與大語言模型的對話示例。為了真實地展示大語言模型的對話能力,對話內(nèi)容中難免會出現(xiàn)用詞不規(guī)范、語句不通順甚至錯誤的情況。在此,懇請各位讀者包涵。
致謝
在本書的創(chuàng)作旅程中,感激所有給予我們支持的人。感謝我的團(tuán)隊成員,他們對技術(shù)的信仰和對卓越的追求為本書注入了靈魂;感謝行業(yè)內(nèi)的所有貢獻(xiàn)者,他們的研究和實踐成果為我們提供了寶貴的參考和靈感;感謝電子工業(yè)出版社鄭柳潔編輯和整個出版團(tuán)隊,他們的專業(yè)技能和對細(xì)節(jié)的關(guān)注,確保了這本書能夠完美地呈現(xiàn)給廣大讀者。感謝所有直接或間接參與本書創(chuàng)作的人,是你們讓這一切成為可能。
楊青
度小滿金融技術(shù)委員會執(zhí)行主席、數(shù)據(jù)智能應(yīng)用部總經(jīng)理,度小滿AI Lab負(fù)責(zé)人,碩士畢業(yè)于清華大學(xué)計算機(jī)系,曾就職于百度、阿里巴巴,從事自然語言處理、搜索、推薦、大數(shù)據(jù)架構(gòu)等相關(guān)方向的研發(fā)工作。
2018年年初加入度小滿金融,組建數(shù)據(jù)智能部和AI Lab團(tuán)隊,從0到1構(gòu)建度小滿金融的智能引擎核心算法,深耕計算機(jī)視覺、自然語言處理、圖模型、機(jī)器學(xué)習(xí)、因果推斷等技術(shù)領(lǐng)域,多篇文章被EMNLP、ACL、CIKM等國際會議收錄,智能化征信解讀中臺工程榮獲吳文俊人工智能科技進(jìn)步獎。相關(guān)技術(shù)廣泛應(yīng)用于度小滿營銷、經(jīng)營、風(fēng)控、反欺詐全流程業(yè)務(wù)場景,為上千萬客戶提供穩(wěn)定、安全的金融服務(wù)。
目前,專注于AIGC相關(guān)研究及產(chǎn)品落地工作,基于度小滿模型即服務(wù)(MaaS)的模式積極探索文生圖、數(shù)字人與生成式大語言模型的應(yīng)用轉(zhuǎn)化。于2023年年初帶領(lǐng)團(tuán)隊發(fā)布千億參數(shù)規(guī)模的中文大語言模型軒轅。2023年9月, 軒轅-70B大語言模型在C-Eval和CMMLU兩大權(quán)威榜單上位列所有開源模型榜首。