自然语言处理基本理论和方法(第2版)

  • 作者:陈鄞
  • 责编:李广鑫
  • ISBN:978-7-5603-4126-2
  • 出版日期:2017.01
  • 所属丛书:
  • 定价:28.00元
  • 开本:16
  • 页数:192
  • 点击购买:

【内容简介】

本书对自然语言处理的基本理论和方法进行介绍。主要内容包括字符集的编码体系、语言计算模型、语言学资源建设、自然语言的词法分析、句法分析和语义分析等。本书内容源于作者多年的教学及科研心得,适合作为高等院校计算机相关专业本科生及研究生课程的教材。

 

【目  录】

1  绪论 

11什么是自然语言处理 

12自然语言处理的研究内容 

13自然语言处理的应用领域 

14自然语言处理中用到的知识 

15自然语言处理面临的困难   

151歧义现象的处理   

152未知语言现象的处理 

16自然语言处理的基本方法及其发展 

17学科现状 

18语言、思维和理解 

19本书结构   

本章小结   

思考练习

2  语料库与词汇知识库 

21语料库   

211基本概念   

212语料库类型   

213典型语料库介绍   

214语料处理的基本问题 

22词汇知识库   

221  WordNet   

222知网   

本章小结   

思考练习

3  n元语法模型 

31 n元语法的基本概念 

32数据平滑技术   

321 Laplace法则   

322 GoodTrur1ng估计   

323绝对折扣和线性折扣   

324 W1ttenBell平滑算法   

325扣留估计   

326交叉校验   

327删除插值法   

328 Katz回退算法 

33开发和测试模型的数据集 

34基于词类的ngram模型 

本章小结 

思考练习

4  隐马尔科夫模型 

41马尔科夫模型 

42隐马尔科夫模型 

43 HMM的三个基本问题   

431求解观察值序列的概率   

432确定最优状态序列   

433 HMM的参数估计   

本章小结   

思考练习

5  常用机器学习方法简介 

5决策树 

52贝叶斯分类器 

53支持向量机 

54最大熵模型 

55感知器 

56 Boost1ng 

本章小结 

思考练习

6  字符编码与字频统计 

61西文字符编码 

62中文字符编码   

62国标码  

622大五码    

623 Un1code1SO1EC 10646     

624国标扩展码   

625 GB 18030   

63字符编码知识的作用 

64字频统计   

641字频统计的应用   

642单字字频统计   

643双字字频统计   

本章小结   

思考练习

7  词法分析   

71汉语自动分词及其基本问题   

711分词规范与词表   

712切分歧义问题   

713未登录词识别问题 

72基本分词方法   

721最大匹配法   

722最少分词法   

723最大概率法   

724与词性标注相结合的分词方法   

725基于互现信息的分词方法   

726基于字分类的分词方法   

727基于实例的汉语分词方法 

73中文姓名识别   

731基于规则的方法   

732基于统计的方法 

74汉语自动分词系统的评价 

75英语形态还原 

76词性标注   

761词性标记集   

762基于规则的词性标注方法   

763基于统计的词性标注方法   

本章小结   

思考练习

8  句法分析 

81文法的表示 

82自顶向下的句法分析 

83自底向上的句法分析   

831移近一归约算法   

832欧雷分析法   

833线图分析法   

834 cYK分析法 

84概率上下文无关文法 

85浅层句法分析   

851问题的提出   

852基于规则的方法   

853基于统计的方法 

86句法分析系统评测   

本章小结   

思考练习

9  语义分析 

91词义消歧   

911基于规则的词义消歧   

912基于统计的词义消歧   

913基于实例的词义消歧   

914基于词典的词义消歧 

92语义角色标注   

92格语法   

922基于统计机器学习技术的语义角色标注 

93深层语义推理   

931命题逻辑和渭词逻辑   

932语义网络   

933概念依存理论   

本章小结   

思考练习

参考文献