基于实体-属性框架的航空领域知识库的构建及应用
The Construction of Aviation Knowledge Base Under the Entity-attribute Frame
知识库是各种信息处理系统不可或缺的一项基础性资源.然而目前比较著名的知识库大都是采用人工方式或者在领域专家参与的情况下构建的,自动构建知识库还是一大难题.针对这一问题,本文提出了一种基于实体-属性框架的航空领域知识库的自动构建方法,对实体的各个属性侧面进行提取后以自然结构化的框架方式表示出来,并将其应用到信息检索系统中,有效地扩展了原始查询关键词,提高了检索性能.本文的工作主要包含以下几部分:首先,本文着重研究了知识库构建中的关键技术,即知识获取技术.按照不同知识类型,即实体之间的关系信息及实体的属性信息,本文分别采用了基于SVM的实体关系获取方法和基于多策略的属性信息获取方法,其中,前者是以两实体的释义项为伪文档,采用SVM分类器进行类别决策,将实体关系归到人工定义好的8种关系类型中;后者从前者无法充分利用释义项资源的角度出发,对输入术语的释义项利用规则和模板等进行属性信息的获取.最后,将获取的知识填充到实体-属性框架中,构建了一定规模的航空领域知识库.本文针对传统的基于关键字的检索技术存在的单纯词形匹配的缺点,提出利用已经构建好的航空领域知识库,对检索的原始关键词进行扩展,扩充为语义上相近的关键词集合,进行二次检索,提高了检索性能,得到了更好的检索结果.
- 作者:
- 王迎春
- 学位授予单位:
- 沈阳航空航天大学
- 专业名称:
- 计算机软件与理论
- 授予学位:
- 硕士
- 学位年度:
- 2011年
- 导师姓名:
- 蔡东风
- 中图分类号:
- TP391.1
- 关键词:
- 实体-属性框架;航空领域知识库;航空百科词典;信息检索系统
- entity-attribute frame;aviation knowledge base;Aviation Encyclopedia;information retrieval system