大家好,欢迎来到IT知识分享网。
一.摘要
实体对齐旨在将来自不同知识图(KG)的具有相同含义的实体联系起来,这是知识融合的重要步骤。 现有研究侧重于通过利用知识图谱的结构信息学习实体嵌入来进行实体对齐。这些方法可以聚合来自相邻节点的信息,但也可能带来来自邻居的噪声。 最近,一些研究人员试图成对比较相邻节点以增强实体对齐。然而,他们忽略了实体之间的关系,而实体之间的关系对于邻域匹配也很重要。 此外,现有方法较少关注实体对齐和关系对齐之间的正交互作用。为了解决这些问题,我们提出了一种名为 RNM 的新型关系感知邻域匹配模型,用于实体对齐。 具体来说,我们建议利用邻域匹配来增强实体对齐。 除了在匹配邻域时比较邻居节点外,我们还尝试从连接关系中探索有用的信息。 此外,迭代框架旨在以半监督的方式利用实体对齐和关系对齐之间的正交互作用。 三个真实世界数据集的实验结果表明,所提出的模型 RNM 比最先进的方法表现更好。
二.背景介绍
三.RNM
3.1 实体和关系的嵌入学习
为了对齐两个 KG 的实体,我们将它们嵌入到相同的潜在空间中以使其具有可比性。 类似地,我们将两个 KG 的关系嵌入到相同的潜在空间中以进行关系对齐。 为了探索知识图谱中实体和关系之间的相互作用,我们建议共同学习实体和关系的嵌入。
3.1.1 实体嵌入
较小的 d ( e i , e j ′ ) d(e_i, e’_j) d(ei,ej′) 表示两个实体 $e_i $和 $e’_j $之间对齐的概率较高。
为了将两个知识图谱的实体嵌入到同一个潜在空间中,我们将种子对齐作为训练数据,并为实体对齐设计了一个基于边缘的损失函数,如下所示:
其中 L 表示预对齐实体对的集合,L’ 是最近邻采样时的一组负对齐,γ > 0 表示边距。 损失函数假设对齐的实体对之间的距离应该接近于零,而负样本之间的距离应该尽可能远。
3.1.2 关系嵌入
其中 r ∈ R 2 d ~ r∈R^{2 \widetilde d} r∈R2d
表示关系 r ∈ R 1 ∪ R 2 r ∈ R_1 ∪ R_2 r∈R1∪R2 的嵌入,concat 表示串联操作, g r h g^h_r grh 和 g r t g^t_r grt 分别表示 r 的所有不同头实体和尾实体的平均嵌入。
此外,为了进一步探索基于三元组的关系的翻译信息,受 TransE 的启发,我们设计了一个正则化器,如下所示,
其中 T 1 T_1 T1 和 T 2 T_2 T2 分别表示两个给定 KG G 1 G_1 G1 和 G 2 G_2 G2 的三元组集。 W R ∈ R d ~ × 2 d ~ W_R∈R^{\widetilde d×2\widetilde d} WR∈Rd
×2d
表示从潜在关系空间到潜在实体空间的变换矩阵,这是要学习的模型参数。
3.1.3 目标函数
其中 λ 是一个权衡系数,用于平衡实体对齐的损失和考虑到关系嵌入的正则化损失。 我们的目标是在实体嵌入的预训练之后最小化上面的函数。 此外,我们利用 Adam进行目标优化。
3.2 关系感知邻域匹配
其中 λ e λ_e λe 是控制嵌入距离和匹配分数之间权衡的超参数。匹配分数越大表示候选实体对对齐的概率越高。
3.3 实体感知关系匹配
对于来自不同知识图谱的两个关系,我们假设头实体和尾实体在其关联的三元组中同时对齐的次数越多,这两个关系越有可能具有相同的含义。 对于关系 r,我们将 S r = ( h , t ) ∣ ( h , r , t ) ∈ T S_r = {(h, t)|(h, r, t) ∈ T} Sr=(h,t)∣(h,r,t)∈T 定义为其相关实体对的集合,其中 T 表示给定 KG 中的三元组集合。因此,给定候选关系对 ( r i , r j ′ ) (r_i, r’_j) (ri,rj′),其中 r i r_i ri 来自 G1, r j ′ r’_j rj′ 来自 G2,我们首先形成相应的实体对集 S r i S_{r_i} Sri 和 S r ′ j S_{
{r’}_j} Sr′j。 然后,我们比较 C i j r = ( h 1 , h 2 ) , ( t 1 , t 2 ) ∣ ( h 1 , t 1 ) ∈ S r i , ( h 2 , t 2 ) ∈ S r j ′ C^r_{ij} = {(h_1, h_2),(t_1, t_2)|(h_1, t_1) ∈ S_{r_i},(h_2, t_2) ∈S_{r’_j}} Cijr=(h1,h2),(t1,t2)∣(h1,t1)∈Sri,(h2,t2)∈Srj′ 中的所有实体对,并将匹配集 M i j r M^r_{ij} Mijr 定义为 C i j r C^r_{ij} Cijr的子集,其中元素满足 ( h 1 , h 2 ) ∈ L e (h_1, h_2) ∈ L_e (h1,h2)∈Le 和 ( t 1 , t 2 ) ∈ L e (t_1, t_2) ∈ L_e (t1,t2)∈Le 的条件。 因此,关系对 ( r i , r j ′ ) (r_i, r’_j) (ri,rj′) 之间的距离可以更新如下:
其中 λ r λ_r λr 是权衡系数。 与实体对的距离度量类似,我们同时考虑了关系对的嵌入距离和匹配分数。
3.4 迭代策略和实施细节
为了利用实体对齐任务和关系对齐任务之间的正向交互,我们设计了一个半监督框架,其中实体对齐和关系对齐可以迭代地相互增强。令 D e ∈ R ∣ E 1 ∣ × ∣ E 2 ∣ D^e ∈ R^{|E_1|×|E_2|} De∈R∣E1∣×∣E2∣ 表示实体对从 KG1 到 KG2 的距离矩阵, D r ∈ R ∣ R 1 ∣ × ∣ R 2 ∣ D^r ∈ R^{|R_1|×|R_2|} Dr∈R∣R1∣×∣R2∣ 表示从 KG1 到 KG2 的关系对的距离矩阵。 算法 1 给出了 RNM 的迭代策略:
D e D^e De 的初始化定义如下,其中包含学习到的实体嵌入:
D r D^r Dr 的初始化可以用学习到的关系嵌入写成如下:
D e D^e De 和 D r D^r Dr 可用于对齐排序或对齐集生成。 生成或更新对齐集的方法如算法 2 所示:
此外,我们引入反向关系来丰富知识图谱。 例如,对于事实 (Tokyo, CapitalOf, Japan),我们还将构建另一个三元组 ( J a p a n , C a p i t a l O f − 1 , T o k y o ) (Japan, CapitalOf^{-1} , Tokyo) (Japan,CapitalOf−1,Tokyo)。 因此,给定 KG 的关系集和三元组集将相应地扩大。
3.5 实验结果
四.总结
本文提出了一种名为RNM的新型关系感知邻域匹配模型,用于实体对齐。 模型共同学习实体和关系的嵌入。 此外,利用关系的语义信息和映射属性来实现更好的实体对齐并且以半监督相互加强的方式迭代地实现实体对齐和关系对齐。在三个跨语言KG数据集上评估了模型,结果证明了RNM的有效性。
五.附录
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/134502.html