开发工具:
文件大小: 212kb
下载次数: 0
上传时间: 2019-04-20
详细说明:NULL
博文链接:https://snv.iteye.com/blog/1882241中国武技论文在线
http://www.paper.edu.cn
是一个实例在某木体中即属于概念A又属」概念B的可能性。P(A,B)表示一个实例在某木
体中属于概念A但不属于概念B的可能性。P(A,B)表小一个实例在某本体中不属于概念A
但属于概念B的可能性。在计算P(A,B)、P(A,B)、P(A,B)时要用到概念A和概念B在各
自本体中的实例个数。
用 Jaccard系数公式(2)我们可以计算出概念A和概念B基于实例的相似度
Simens(A,B)。
24基于属性计算概念相似度
在本体中,每个属性也是一个概念。属性有属性名称、属性数据类型、属性实例数据等
要素组成,因此本文判断两个属性是否相似主要从这三个要素的相似度进行考虑
属性名称、属性类犁本身都是字符串,因此可以采用字符串相似度计算方法进行判定。我们
可用前述的 EditDistance方法来比较,也可用 humming distance, N- gramdistance等方法来比
较两个字符串,还可以根据」串相似度来确定字符串的相似栏度。其中, humming distance
具体方法是:两个字符串s和t的相似度的计算公式如下所示,其中若s[i]-t[i],则fi)0,否则
f(i)=1。
min(s,)
∑)+|
Sim(s, t)=
(3)
max(s, tD)
由于每个概念的实例对该概念的每一个属性都分配了一个相应的值,所以对于其他类型
的数据,也可以采用基于实例的方法进行计算。设概念A的属性为a概念B的属性为b,两个
属性间的相似度记为ASim(a,b)。属性相似度计算公式如下:
ASim(ai bi)=w Sim(ai
Iname, name)TW2Sim(a
datatype, bjdatatype)+waSim(instance, bjinstance)
(4)
其中w1、w2、w3是权重,代表属性名称、类型、数据对属性相似度计算的重要程度,w1+w2+
w=1。设概念A和概念B之间共计算出m个ASim(a,b并设置相应的权值wkby。概念
A和概念B基于属性的相似度计算公式为
∑
Simatribute(A, B)=6-1 airbone ASim(a,b
(5)
attribute
由于一个概念可能有多个属性,每个属性对概念的描述程度和作用也各不相同。如果每
个属性都考虑,则计算量会大大增加。所以在计算属性相似度时,可以先依据机器学习方法
计算出属性的信息增益9只选取几个信息增益人的属性进行相似度的计算这样在一定程度
上可以减少计算量。
5基于关系计算概念相似度
木体中的概念之问都存在一定的关系。关系之间的相似度也可以从名称、类型、实例数
据等要素来考虑。其中名称、类型可用字符串相似度的判定方法来计算,而关系的实例数据
可用基于实例的方法来计算相似度。具体方法、公式与上面基于属性计算概念相似度基本相
同,在此不再赘述.根据这些方法可计算出基于关系的相似度 Simnel(A,B)
中国武技论文在线
http://www.paper.edu.cn
26概念相似度计算的改进
如图1的算法图所示,我们先用基于语法的方法计算出概念的名称相似度
Sim(A,B),然后从语义角度考虑,用基于实例的方法计算出相似度 Sim(A,B),把上
述计算出的相似度合并起米,便可得到从概念自身角度考虑得到相似度 Sim(A,B)
计算公式如下:
Sim
(6)
concept
(A,B)
(A, B)+wins tance si
A, B)
因为考虑到概念的属性和关系对其相似度的计算有着重要的辅助作用,在本文中,我们
利用上述的基」概念属性和基」关系分别计算出相似度 Sim(A,B)和 Sin . t(A,B),
并将其按权相加,从而得到辅助相似度 Sim(A,B)。公式如下
Sim asie tan (a, b)=
attribute slm
attribute
(A, B)+w
relation
Sim
relaton
(A,B)
最后再将计算得出的概念自身相似度 Sim concent(A,6)和辅助相似度 Sim asistant(A,B)合并起
来,得到最终的概念相似度Sm(A,B)。公式为
Sim(A, B)=w concepr Sim concept (A, B)w assis tan, Sim assis tan, (A, B)
(8)
其中: W+ W=1
attribute tW
relation
once
assis tan t
=1。权值的具体设置根
据具体环境由用户确定。
3.结论
本文采用了综合的相似度计算方法,虽然比单纯的基于语法或基于实例的相似度计算公
式计算量更多,但对」概念相似度的计算更能反映概念之间的相似关系。而且,木文充分考
虑了概念的属性和关系对相似性所起的重要作用,通过选择合适的杖值,可以桷保概念相似
度的计算更全面、更准确
参考文献
[1] Borst WN. Construction of Engineering Ontologies. University of Twente Enschede, 199
[2]A Kivela, E Hyvonen Ontological theories for the Semantic Web[M]. Helsinki: HIIT Publications, 2002: 111-136
[3 Doan A H. Learning to map between structured representations of data. Phthesis. University of Washington. 2002
4 Alexander M, Boris M. MAFRA---a mapping framework for distributed ontologies. Web Intelligence and Agent
stem. 2003
[5] Melnik S, Garcia-Molina H, Rahm E Similarity flooding: a versatile graph matching algorithm, In: Proc of the 18th
Intl Conf on Data Engineering(ICDE), San Jose, CA, 2002
[61 P Mitra, n F Noy, A R Jaiswal OMEN: A Probabilistic Ontology Mapping Tool[J1, Workshop on Meaning
coordination and negotiation at the Third International Conference on the Semantic
Web(IS wC-2004), Hiroshima, Japan
[7 Kong C Y,Wang C L, Lau F C MOntology mapping in pervasive Computing environment
Url:http:/www.csis.hkuhk/clwang/papcrs/euc2004-laurcl.pdf
[8 van Rijsbergen Information Retrieval[M], London: Butterworths, 1979.Second Edition
[9 Fan Ming, Meng Xiaofeng. Data Mining Concept and Technology. Beijing: Publishing House of machine
industry, 2001
中国武技论文在线
http://www.paper.edu.cn
Improvement for the concept similari
ty of ontology mapping
Zhou shengbao, Guo Junfang
Department of Mathematics and Computer Science, Shanxi datong University, Shanxi datong
(037009)
Abstract
With analysis of many kinds of ontology mapping approaches, to aim at the current problems of the
computation of concept similarity, in this paper, a improved ontology mapping approach is put
orward. This approach adequately takes name instance, attribute and relation of the concept into
account to the calculation of the similarity, and it make the calculation of the concept similarity more
comprehensively and more exactly
Keywords: ontology; ontology mapping: concept similarit
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.