Graph—NB:一种高效准确的多关系朴素贝叶斯分类算法

刘红岩1,陈海亮1,Han Jiawei2,Yin Xiaoxin2
(1清华大学经济管理学院,北京 100084,2美国伊利诺大学香槟分校计算机科学系,厄巴纳 61801)

文 摘: 多关系分类是数据挖掘领域中的研究和应用热点。已有多关系朴素贝叶斯分类算法将所有与目标表相连的表都考虑在内,包括语义关系很弱的表。为此,本文提出一种新的分类算法 Graph NB。它通过对表进行剪裁,达到优化语义关系图,从而一定程度上消除无关表对分类影响的目的。该算法实现了深度优先与广度优先两种遍历策略。实验结果表明,语义关系图的优化可以提高分类准确度和运行效率,相比于其他算法,该算法运行时间短,分类准确度高。

关键词:多关系分类 ,朴素贝叶斯分类,深度优先,广度优先
中图分类号:TP311,TP391
通讯作者:刘红岩,清华大学经济管理学院,副教授,e-mail:liuhy@sem.tsinghua.edu.cn
*基金项目国家自然科学基金(70471006,70621061)
下载