關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
專利信息語(yǔ)義表示與深度挖掘 以專利數(shù)據(jù)語(yǔ)義表示為基礎(chǔ),專利信息深度挖掘問(wèn)題能夠得到更好的解決。本書(shū)根據(jù)專利數(shù)據(jù)分析與挖掘的一般流程,結(jié)合其中的研究重點(diǎn)和研究熱點(diǎn),著力解決以下5個(gè)方面的問(wèn)題。 ①專利科學(xué)引文元數(shù)據(jù)抽取和分析。當(dāng)前科學(xué)技術(shù)間的關(guān)聯(lián)研究主要通過(guò)非專利引文分析實(shí)現(xiàn),非專利引文包括期刊論文、會(huì)議論文、著作、文件等多種類型,而其中很多類型并不能作為科學(xué)知識(shí)的代表。如何借鑒和改進(jìn)表示學(xué)習(xí)方法,快速準(zhǔn)確地識(shí)別出非專利引文中的專利科學(xué)引文,進(jìn)而抽取專利科學(xué)引文中的多種特征項(xiàng)來(lái)表示專利引用的科學(xué)知識(shí),實(shí)現(xiàn)更準(zhǔn)確的科學(xué)技術(shù)關(guān)聯(lián)分析,研究科學(xué)知識(shí)與技術(shù)應(yīng)用間的知識(shí)轉(zhuǎn)移和流動(dòng),是專利信息深度挖掘的基礎(chǔ)性工作。 ②無(wú)監(jiān)督跨語(yǔ)言專利推薦?缯Z(yǔ)言專利推薦可以為企業(yè)和個(gè)人遴選相關(guān)重要專利、發(fā)現(xiàn)相關(guān)技術(shù)發(fā)展趨勢(shì)、追蹤技術(shù)進(jìn)展提供輔助,進(jìn)而提供個(gè)性化的信息推送和決策支持服務(wù),是有效獲取其他語(yǔ)言相關(guān)專利的重要途徑。當(dāng)前,跨語(yǔ)言專利推薦多從查詢?cè)~和文本精確翻譯的角度出發(fā),往往需要大規(guī)模特定領(lǐng)域的雙語(yǔ)詞典、雙語(yǔ)語(yǔ)料庫(kù)及高效準(zhǔn)確的機(jī)器翻譯等方法來(lái)實(shí)現(xiàn)有監(jiān)督的跨語(yǔ)言查詢擴(kuò)展,導(dǎo)致這些方法應(yīng)用擴(kuò)展到其他領(lǐng)域進(jìn)行跨語(yǔ)言專利推薦的難度較大。與此同時(shí),由此推薦的專利大多是相似專利,推薦的多樣性和相關(guān)性尚需進(jìn)一步擴(kuò)展,亟須從專利文本語(yǔ)義表示角度出發(fā)進(jìn)行相關(guān)專利推薦,以提供更好的決策支持服務(wù)。 ③技術(shù)機(jī)會(huì)預(yù)測(cè)。技術(shù)機(jī)會(huì)作為技術(shù)創(chuàng)新及市場(chǎng)創(chuàng)新活動(dòng)的基礎(chǔ),可以為企業(yè)提供可能的未來(lái)發(fā)展方向參考,是進(jìn)行任何一項(xiàng)技術(shù)創(chuàng)新活動(dòng)都要考慮的重要因素,也是決定企業(yè)能否順利開(kāi)展技術(shù)創(chuàng)新活動(dòng)的關(guān)鍵環(huán)節(jié)。當(dāng)前研究主要側(cè)重于對(duì)已發(fā)生的技術(shù)機(jī)會(huì)進(jìn)行發(fā)現(xiàn),而技術(shù)機(jī)會(huì)預(yù)測(cè)則多是通過(guò)分析大量歷史數(shù)據(jù)進(jìn)行驗(yàn)證。實(shí)際上,當(dāng)技術(shù)機(jī)會(huì)出現(xiàn)時(shí),一般還沒(méi)有積累大量數(shù)據(jù),特別是在技術(shù)機(jī)會(huì)尚處于萌芽階段的時(shí)候。因此,需要借助表示學(xué)習(xí)方法和類比設(shè)計(jì)方法,協(xié)同利用具有類似功能或效果的相關(guān)領(lǐng)域數(shù)據(jù),在尚未累積大量數(shù)據(jù)的技術(shù)萌芽期對(duì)技術(shù)機(jī)會(huì)進(jìn)行預(yù)測(cè),更好地支撐數(shù)據(jù)驅(qū)動(dòng)的管理決策。 ④技術(shù)融合預(yù)測(cè)。技術(shù)融合是新技術(shù)產(chǎn)生的重要來(lái)源,預(yù)測(cè)潛在的技術(shù)融合成為企業(yè)提高競(jìng)爭(zhēng)能力、獲取競(jìng)爭(zhēng)優(yōu)勢(shì)甚至是顛覆現(xiàn)有市場(chǎng)的有效和重要的技術(shù)手段。當(dāng)前,技術(shù)融合預(yù)測(cè)的定量分析和研究主要從3個(gè)角度展開(kāi),包括基于專利引用的技術(shù)融合預(yù)測(cè)、基于專利分類號(hào)共現(xiàn)的技術(shù)融合預(yù)測(cè)及基于專利文本的技術(shù)融合預(yù)測(cè),但還存在以下問(wèn)題亟須解決:,專利引用具有一定的時(shí)間滯后性,需要一定的時(shí)間積累,因此現(xiàn)有研究多是對(duì)已有技術(shù)融合的驗(yàn)證,不利于技術(shù)融合預(yù)測(cè)。第二,專利分類號(hào)共現(xiàn)不能體現(xiàn)專利分類號(hào)在序列中的位置特征和上下文語(yǔ)義,由此得到的專利分類語(yǔ)義表示可能存在信息丟失的問(wèn)題。此外,現(xiàn)有研究一般平等對(duì)待專利分類序列中的每個(gè)專利分類號(hào),進(jìn)而賦予同樣的文本信息,造成不同專利分類具有大量相同文本,不利于區(qū)分專利分類。尤為重要的是,專利分類網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容中的每一維特征的貢獻(xiàn)程度可能并不相同,需要針對(duì)不同領(lǐng)域數(shù)據(jù)進(jìn)行針對(duì)性學(xué)習(xí),自動(dòng)調(diào)整特征的權(quán)重和貢獻(xiàn)。 ⑤專利大數(shù)據(jù)處理與分析系統(tǒng)構(gòu)建。全流程專利數(shù)據(jù)處理與分析的工具軟件較少,而且一般僅能實(shí)現(xiàn)專利處理與分析中的某一步驟,無(wú)法形成規(guī)范的輸入輸出,難以簡(jiǎn)便快捷地對(duì)特定領(lǐng)域進(jìn)行全流程分析與處理。此外,需要針對(duì)專利數(shù)據(jù)分析與挖掘,系統(tǒng)調(diào)研專利特征項(xiàng),設(shè)計(jì)專利數(shù)據(jù)倉(cāng)庫(kù),研究和實(shí)現(xiàn)專利大數(shù)據(jù)獲取、解析、預(yù)處理、查詢、統(tǒng)計(jì)、分析和可視化的全流程專利處理與分析系統(tǒng),從而為專利數(shù)據(jù)深度挖掘提供更好的工具軟件支撐。 為了解決上述問(wèn)題,本書(shū)引入表示學(xué)習(xí)理論與方法,研究專利信息語(yǔ)義表示,進(jìn)而針對(duì)情報(bào)分析現(xiàn)實(shí)需要,從專利信息語(yǔ)義表示角度形成了一系列新方法和新技術(shù),主要包括:從專利科學(xué)引文角度出發(fā),提出基于表示學(xué)習(xí)的專利科學(xué)引文識(shí)別、專利科學(xué)引文特征項(xiàng)抽取及多種專利科學(xué)引文內(nèi)容深度挖掘方法;從專利推薦角度出發(fā),利用不同語(yǔ)種但相同語(yǔ)義的詞在語(yǔ)義空間中位置相近的原理,提出基于表示學(xué)習(xí)的無(wú)監(jiān)督跨語(yǔ)言專利推薦方法;從技術(shù)機(jī)會(huì)預(yù)測(cè)角度,結(jié)合表示學(xué)習(xí)和類比設(shè)計(jì),提出基于短語(yǔ)語(yǔ)義表示和類比設(shè)計(jì)的技術(shù)機(jī)會(huì)預(yù)測(cè)方法;從技術(shù)融合預(yù)測(cè)角度,結(jié)合表示學(xué)習(xí)理論與方法,研究專利分類文本賦予及其語(yǔ)義表示、專利分類網(wǎng)絡(luò)結(jié)構(gòu)語(yǔ)義表示及融合表示,形成基于專利分類語(yǔ)義表示的技術(shù)融合預(yù)測(cè)方法;從信息系統(tǒng)構(gòu)建角度,設(shè)計(jì)專利數(shù)據(jù)倉(cāng)庫(kù),研究和實(shí)現(xiàn)專利大數(shù)據(jù)獲取、解析、預(yù)處理、查詢、統(tǒng)計(jì)、分析和可視化的全流程專利處理與分析系統(tǒng)構(gòu)建。
你還可能感興趣
我要評(píng)論
|