自然語言標(biāo)注——用于機器學(xué)習(xí)(影印版)
					 定  價:54 元 
					
				 
				 
				  
				
				   
				  
				  
				
						
								
									當(dāng)前圖書已被 1 所學(xué)校薦購過!
								
								
									查看明細(xì)
 
								 
							
							
								
							
				 
	
				
					
						- 作者:James Pustejovsky, Amber Stubbs著
- 出版時間:2013/6/1
- ISBN:9787564142810
- 出 版 社:東南大學(xué)出版社
 
  
		
				- 中圖法分類:TP391 
- 頁碼:324頁
- 紙張:膠版紙
- 版次:1
- 開本:16K
 
 
	 
	 
	 
	
	
	
		
		  是時候創(chuàng)建屬于你自己的用于機器學(xué)習(xí)的自然語言訓(xùn)練語料庫了。無論你使用英語、漢語或者其他任何一種自然語言,《自然語言標(biāo)注:用于機器學(xué)習(xí)(影印版)》都可以手把手地指導(dǎo)你一種經(jīng)驗證的標(biāo)注開發(fā)周期一一把元語添加到你的訓(xùn)練語料庫中來幫助機器學(xué)習(xí)算法更有效工作的過程。你無需任何編程或者語言學(xué)方面的經(jīng)驗就可以上手。
  通過每一步中的詳細(xì)示例,你將學(xué)到“標(biāo)注開發(fā)過程”是如何幫助你建模、標(biāo)注、訓(xùn)練、測試、評估和修正你的訓(xùn)練語料庫。你也將了解到一個實際標(biāo)注項目的完整演示。
		
	
      在收集你的數(shù)據(jù)集(語料庫)之前定義一個清晰的標(biāo)注目標(biāo)
  學(xué)習(xí)用于分析你的語料庫中語言內(nèi)容的工具
  搭建用于你的標(biāo)注項目的模型和規(guī)范
  檢查從基本的XML到語言標(biāo)記框架這樣一些不同的標(biāo)注格式
  創(chuàng)建適合于訓(xùn)練和測試機器學(xué)習(xí)算法的黃金標(biāo)準(zhǔn)語料庫
  選擇用來處理你的標(biāo)注數(shù)據(jù)的機器學(xué)習(xí)算法
  評估測試結(jié)果并修正你的標(biāo)注任務(wù)
  學(xué)習(xí)如何使用用于標(biāo)注文本和調(diào)整標(biāo)注的輕量級軟件
  Jarues Plastejovsky,是Brandeis大學(xué)的教授,他在該大學(xué)的計算機科學(xué)系講解和研究人工智能及計算語言學(xué)。
  
  Amber Stubbs,剛剛獲得了Brandeis大學(xué)標(biāo)注方法論的博士學(xué)位。她現(xiàn)在是SUNY Albany大學(xué)的博上后。
Preface
1. TheBasics
 The Importance of Language Annotation
  The Layers of Linguistic Description
  What Is Natural Language Processing?
 A Brief History of Corpus Linguistics
  What Is a Corpus?
  Early Use of Corpora  
  Corpora Today  
  Kinds of Annotation
 Language Data and Machine Learnin9  
  Classification
  Clustering
  Structured Pattern Induction
  The Annotation Development Cycle
  Model the Phenomenon
  Annotate with the Specification
  Train and Test the Algorithms over the Corpus
  Evaluate the Results
  Revise the Model and Algorithms
 Summary
2. DefiningYourGoaI and Dataset
 Defining Yoor Goal
  The Statement of Purpose
  Refining Your Goal:Informativity Versus Correctness
  Background Research  
  Language Resources
 ……