主页 详情

《藏文分词与标注研究》_祁坤钰著_96083839_

【书名】:《藏文分词与标注研究》
【作者】:祁坤钰著
【出版社】:兰州:甘肃民族出版社
【时间】:2015
【页数】:203
【ISBN】:
【SS码】:96083839

最新查询

内容简介

第一章 绪论

一、藏文信息处理概述

(一)藏文文字处理

(二)藏文编码标准

(三)藏文操作系统

(四)藏语自然语言处理

二、藏文自动分词与词性标注的概念

(一)基本概念

(二)藏文自动分词与标注的重要性

(三)藏文自动分词与标注的目标

三、藏文自动分词的应用领域

(一)藏外电子翻译

(二)藏文智能信息检索

(三)语音处理技术

(四)自动文摘

第二章 分词与标注的原理

一、语言与词法分析

二、英语的词法分析

(一)形态学的基本概念

(二)英语形态分析

(三)英语的词类划分与标注集

(四)英语词性标注方法

三、汉语的词法分析

(一)汉文分词的概念

(二)汉文分词规范

(三)汉文词类与标注规范

(四)汉文分词方案

(五)汉文标注方案

(六)汉文分词与标注系统介绍

第三章 藏文与藏文文法

一、藏文概述

(一)藏文字的产生

(二)藏文字的厘定和改革

二、藏文文法概述

(一)古印度声明学体系

(二)文法理论的藏译

(三)藏文文法史

(四)藏文文法的主要内容

第四章 藏文自动分词及标注规范

一、藏文分词与标注规范说明

二、使用范围与参考规范

(一)使用范围

(二)参考规范

三、基本术语

四、分词与标注原则

五、词类划分与标注集

六、切分与标注细则

第五章 匹配与统计相结合的分词与标注

一、藏文分词标注现状

(一)分词与标注规范

(二)分词与标注系统

二、藏文分词标注语料库

(一)语料库的属性

(二)语料分类

(三)语料分布表

(四)标注语料实例

三、字符串匹配与统计相结合的藏文分词算法

(一)正向最大匹配方法

(二)逆向最大匹配方法

(三)双向最大匹配方法

(四)切分错误与切分歧义

四、分词词典机制

(一)分词词典数据

(二)词典的数据结构与搜索算法

五、基于隐马尔科夫模型的藏文词性标注

(一)统计与概率的基础概念

(二)统计语言模型

(三)隐马尔科夫模型(HMM)

(四)藏文兼类词

(五)藏文标注模型

(六)HMM模型参数训练

(七)韦特比算法

六、藏文分词与标注测评

(一)黄金标准

(二)评价指标

(三)中文测评

(四)藏文分词与标注测试

七、本方案存在的问题与改进的思路

(一)存在的问题

(二)今后的改进思路

八、本软件的使用

附录

1.藏文国际标准编码

2.英语词性标注集

3.信息处理用现代汉语分词规范

4.信息处理用现代汉语词类标记规范

参考文献