详情

定领域知识图谱自动构建技术研究

申报人:刘功申 申报日期:2021-09-16

基本情况

第二十四期“上海交通大学大学生创新实践计划”项目
定领域知识图谱自动构建技术研究
创新训练项目
工学
计算机类
创新类
2021-09
2021-09
电子信息与电气工程学院
刘功申
指导教师
登录状态下查看
博士,教授,博士生导师。2003年7月毕业于上海交通大学计算机系并获博士学位;2004年至今,于上海交通大学网络空间安全学院从事教学科研工作。2014年在亚利桑那州立大学访学一年。研究兴趣人工智能安全、自然语言理解、内容安全、恶意代码防范等。主持了3项国家自然科学基金项目,1项“十二五”重大专项子课题,1项科技委专项(原H863项目),正在主持1个与“东方头条”的校企联合实验室项目以及若干企业合作项目。作为主要技术核心人员,参与“信息内容分析技术国家工程实验室”建设项目、973项目、自然基金重点项目、“十三五”国家科技攻关计划项目等10多项。获得上海市优秀教材一等奖2项,保密科学技术奖1项。指导全国大学生信息安全大赛获得一等奖4项,优秀指导教师2项获得校级烛光奖一等奖、优秀教师二等奖、教书育人奖三等奖各1项。

针对知识图谱的自动构建技术,指导教师指导的研究生已经完成过两篇硕士论文,并发表了3篇领域内较好的学术论文。具有较好的研究基础,基本明确的研究思路。目前具备的条件如下:

(1)数据资源:具备构造通用知识图谱的数据。

(2)计算资源:实验室能提供远程使用的服务器。

(3)人员支持:除指导教师外,有相关方向的研究生参与指导。


1 知识抽取
知识抽取主要是面向开放的链接数据,通常典型的输入是自然语言文本或者多媒体内容文档等。然后通过自动化或者半自动化的技术抽取出可用的知识单元,知识单元主要包括实体、关系以及属性3个知识要素,并以此为基础,形成一系列高质量的事实表达,为上层模式层的构建奠定基础。

2 知识表示
传统的知识表示方法主要是以RDF(Resource Deion Framework资源描述框架)的三元组SPO(subject,predicate,object)来符号性描述实体之间的关系。但是其在计算效率、数据稀疏性等方面面临诸多问题。近年来,以深度学习为代表的学习技术取得了重要的进展,可以将实体的语义信息表示为稠密低维实值向量,进而在低维空间中高效计算实体、关系及其之间的复杂语义关联,对知识库的构建、推理、融合以及应用均具有重要的意义。

3 知识融合
通过知识提取,实现了从非结构化和半结构化数据中获取实体、关系以及实体属性信息的目标。但是由于知识来源广泛,存在知识质量良莠不齐、来自不同数据源的知识重复、层次结构缺失等问题,所以必须要进行知识的融合。

4.知识推理
知识推理(www.golaxy.cn)则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。在推理的过程中,往往需要关联规则的支持。由于实体、实体属性以及关系的多样性,人们很难穷举所有的推理规则,一些较为复杂的推理规则往往是手动总结的。对于推理规则的挖掘,主要还是依赖于实体以及关系间的丰富同现情况。知识推理的对象可以是实体、实体的属性、实体间的关系、本体库中概念的层次结构等。知识推理方法主要可分为基于逻辑的推理与基于图的推理两种类别。

选题成员

0

指导教师

序号 教师姓名 电子邮箱 所属学院
1 刘功申 登录状态下查看 电子信息与电气工程学院 第一指导教师

选题附件

结束