图书中心

首页图书中心图书推荐

自然语言处理基本理论和方法（第2版）

作者：陈鄞

责编：李广鑫

ISBN：978-7-5603-4126-2
出版日期：2017.01
所属丛书：

定价：28.00元
开本：16
页数：192

点击购买：

【内容简介】

本书对自然语言处理的基本理论和方法进行介绍。主要内容包括字符集的编码体系、语言计算模型、语言学资源建设、自然语言的词法分析、句法分析和语义分析等。本书内容源于作者多年的教学及科研心得，适合作为高等院校计算机相关专业本科生及研究生课程的教材。

【目　　录】

第1章绪论

1．1什么是自然语言处理

1．2自然语言处理的研究内容

1．3自然语言处理的应用领域

1．4自然语言处理中用到的知识

1．5自然语言处理面临的困难

1．5．1歧义现象的处理

1．5．2未知语言现象的处理

1．6自然语言处理的基本方法及其发展

1．7学科现状

1．8语言、思维和理解

1．9本书结构

本章小结

思考练习

第2章语料库与词汇知识库

2．1语料库

2．1．1基本概念

2．1．2语料库类型

2．1，3典型语料库介绍

2．1．4语料处理的基本问题

2．2词汇知识库

2．2．1 WordNet

2．2．2知网

本章小结

思考练习

第3章 n元语法模型

3．1 n元语法的基本概念

3．2数据平滑技术

3．2．1 Laplace法则

3．2．2 GoodTrur1ng估计

3．2．3绝对折扣和线性折扣

3．2．4 W1tten—Bell平滑算法

3．2．5扣留估计

3．2．6交叉校验

3．2．7删除插值法

3．2．8 Katz回退算法

3．3开发和测试模型的数据集

3．4基于词类的n—gram模型

本章小结

思考练习

第4章隐马尔科夫模型

4．1马尔科夫模型

4．2隐马尔科夫模型

4．3 HMM的三个基本问题

4．3．1求解观察值序列的概率

4．3．2确定最优状态序列

4．3．3 HMM的参数估计

本章小结

思考练习

第5章常用机器学习方法简介

5．1 决策树

5．2贝叶斯分类器

5．3支持向量机

5．4最大熵模型

5．5感知器

5．6 Boost1ng

本章小结

思考练习

第6章字符编码与字频统计

6．1西文字符编码

6．2中文字符编码

6．2．1 国标码

6．2．2大五码

6．2．3 Un1code与1SO／1EC 10646

6．2．4国标扩展码

6．2．5 GB 18030

6．3字符编码知识的作用

6．4字频统计

6．4．1字频统计的应用

6．4．2单字字频统计

6．4．3双字字频统计

本章小结

思考练习

第7章词法分析

7．1汉语自动分词及其基本问题

7．1．1分词规范与词表

7．1．2切分歧义问题

7．1．3未登录词识别问题

7．2基本分词方法

7．2．1最大匹配法

7．2．2最少分词法

7．2．3最大概率法

7．2．4与词性标注相结合的分词方法

7．2．5基于互现信息的分词方法

7．2．6基于字分类的分词方法

7．2．7基于实例的汉语分词方法

7．3中文姓名识别

7．3．1基于规则的方法

7．3．2基于统计的方法

7．4汉语自动分词系统的评价

7．5英语形态还原

7．6词性标注

7．6．1词性标记集

7．6．2基于规则的词性标注方法

7．6，3基于统计的词性标注方法

本章小结

思考练习

第8章句法分析

8．1文法的表示

8．2自顶向下的句法分析

8．3自底向上的句法分析

8．3．1移近一归约算法

8．3．2欧雷分析法

8．3．3线图分析法

8．3．4 cYK分析法

8．4概率上下文无关文法

8．5浅层句法分析

8．5．1问题的提出

8．5．2基于规则的方法

8．5．3基于统计的方法

8．6句法分析系统评测

本章小结

思考练习

第9章语义分析

9．1词义消歧

9．1．1基于规则的词义消歧

9．1．2基于统计的词义消歧

9．1．3基于实例的词义消歧

9．1．4基于词典的词义消歧

9．2语义角色标注

9．2．1 格语法

9．2．2基于统计机器学习技术的语义角色标注

9．3深层语义推理

9．3．1命题逻辑和渭词逻辑

9．3．2语义网络

9．3．3概念依存理论

本章小结

思考练习

参考文献

中华人民共和国工业和信息化部	国家新闻出版署	黑龙江省新闻出版局	哈尔滨工业大学	哈尔滨工程大学出版社
北京航空航天大学出版社	西北工业大学出版社	北京理工大学出版社