2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、全自動的語義分析一直是自然語言理解的主要任務之一。通過深層語義分析,可以將自然語言轉化為形式語言,從而使計算機能夠與人類無障礙的溝通。為達此目的,人們已經進行了多年的努力,然而由于這一問題過于復雜,目前取得的效果并不理想。淺層語義分析是對深層語義分析的一種簡化,它只標注與句子中謂詞有關的成分的語義角色,如施事、受事、時間和地點等。其能夠對問答系統、信息抽取和機器翻譯等應用產生推動作用。語義角色標注是淺層語義分析的一種實現方式,具有定義清

2、晰,便于評價的優(yōu)點,近年來受到越來越多學者的關注。
  目前主流的語義角色標注研究集中于使用各種統計機器學習技術,利用多種語言學特征,進行語義角色的識別和分類。近年的研究表明,影響語義角色標注系統性能的首要因素并非機器學習模型,而是使用的特征。因此,若想提高系統的性能,細致的特征工程工作是必不可少的。然而,隨著越來越多特征的加入,特征之間的相互影響越來越嚴重,使得系統性能增長的趨勢逐漸趨緩,并達到一個上限。為此必須尋找新的方法以解

3、決這一問題。
  基于核的方法通過對已有特征進行組合或者分解,將低維特征空間映射到高維特征空間,從而將在低維空間不容易區(qū)分的問題在高維空間加以解決,是一種可行的解決方案。
  本文正是利用核方法這一優(yōu)點,將其應用于語義角色標注這一問題中。除了使用已有的核方法外,還提出了多種新的核方法。
  首先,我們構造了一個語義角色標注基線系統,該系統使用特征向量表示待分類對象,并在特征向量之上,使用基于多項式核的方法,自動的對特征

4、進行組合。實驗結果表明,當使用二次多項式核對特征進行兩兩組合時,該系統是目前已知的最好的基于單句法分析器的語義角色標注系統之一。
  接著,我們針對基線系統中,特征向量很難恰當的表示結構化的特征這一問題,使用了卷積樹核自動將較大的結構特征進行分解,并能夠在多項式時間內進行核函數的計算。然而,通常的卷積樹核混淆了語義角色標注中不同的特征,因此,我們提出了混合卷積樹核融合多種樹核,來對不同種類的特征分別進行建模,最終獲得優(yōu)于標準卷積樹

5、核的性能。然后將混合卷積樹核與二次多項式核進行融合,得到的復合核取得了比單獨使用兩種核都好的結果。
  但是,標準卷積樹核要求兩棵子樹之間必須是精確匹配的,而不考慮結構相似,語義角色相同的情況。因此,我們提出了新的句法驅動卷積樹核,在核函數的設計過程中,融入了語言學知識,容許結構和節(jié)點的近似匹配,最終取得了較標準卷積樹更好的性能。最后同樣與多項式核進行融合,并取得了更好的性能。
  最后,我們使用基于核的方法,實現了一個目前

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論