北京印刷学院,信息工程学院,北京
收稿日历:2024年1月18日;托付日历:2024年2月21日;发布日历:2024年2月29日
摘抄
现存基于图神经网罗的音乐保举模子在团聚模式上忽略了节点自身与邻域的权重分拨,无数模子仅仅通俗的相加或拼接,这种团聚模式莫得充分挖掘节点特征的各异性,针对以上问题,本文冷漠了基于加权团聚图神经网罗的音乐保举模子MGWA,当先把柄用户神色交互的行径记载来构建学问图,然后图神经网罗通过逐层团聚邻域信息来丰富神色暗意和传播高阶信息,颠倒的,在团聚阶段,咱们对节点自身和其邻域接纳门控机制进行权重分拨,从而更好地捕捉节点特征暗意。此外,门控机制不错把柄节点自身偏激邻域的特征动态地分拨权重,这使得团聚模式愈加生动和可学习,从而更好地相宜不同的图结构和节点特征。临了,本文评估了所冷漠模子在委果数据集上的性能,与常见保举模子进行对比,推行成果诠释了咱们的模子在AUC、F1等筹办上均取得了升迁。
关节词
音乐保举,图神经网罗,加权团聚
Music Recommendation Model Based on Graph Neural Network with Weighted Aggregation
Han Xiao, Dezhi Sun, Fucheng You
School of Information Engineering, Beijing Institute of Graphic Communication, Beijing
Received: Jan. 18th, 2024; accepted: Feb. 21st, 2024; published: Feb. 29th, 2024
ABSTRACT
The existing music recommendation model based on graph neural network ignores the weight distribution between the node itself and the neighborhood, and most models simply add or splice, which does not fully exploit the differences of node characteristics. To solve the above problems, this paper proposes a music recommendation model (MGWA) based on graph neural network with weighted aggregation. Firstly, a knowledge graph is constructed according to the behavior records of user interaction. Then graph neural network enriches the project representation and spreads high-order information by aggregating neighborhood information layer by layer. Especially, in the aggregation stage, we use gating mechanism to assign weights to nodes themselves and their neighborhoods, so as to better capture the node feature representation. In addition, the gating mechanism can dynamically allocate weights according to the characteristics of nodes themselves and their neighbors, which makes the aggregation method more flexible and learnable, thus better adapting to different graph structures and node characteristics. Finally, this paper evaluates the performance of the proposed model on real data sets, and compares it with the common recommended models. The experimental results prove that our model has achieved improvement in AUC, F1 and other indicators.
Keywords:Music Recommendation, Graph Neural Networks, Weighted Aggregation
Copyright © 2024 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
1. 前言
音乐保举系统算作电子商务和文娱产业中的进击应用,一直备受怜惜。跟着互联网和挪动设备的普及,用户对个性化、精确的音乐保举需求日益增多。传统的音乐保举系统主要基于骨子的保举和协同过滤等设施 [1] ,这些设施在一定进度上简略为用户提供保举,但往往忽视了用户和神色之间的复杂关系,难以充分挖掘用户和神色的特征信息。基于骨子的设施主要依靠音乐本人的特征,如歌手、家数、格调等来进行保举,而协同过滤设施则是基于用户行径数据进行保举,如用户对音乐的播放记载、评分等。然则,这些设施存在一些局限性,举例骨子过滤设施容易受到冷驱动问题的影响,即新音乐或新用户难以得到准确的保举;而协同过滤设施则容易出现数据稀疏和保举热门等问题,影响了保举的准确性和个性化进度。
为了克服传统音乐保举系统的局限性,连年来基于深度学习和图神经网罗的音乐保举模子渐渐成为谋划热门 [2] [3] [4] 。这些模子通过建模用户和神色之间的关系图,简略更好地捕捉其特征暗意,提高保举的准确性和个性化进度。图神经网罗简略灵验地处理图结构数据 [5] ,将节点和边的信息进行领悟,从而更好地挖掘节点之间的关联和特征暗意。在音乐保举边界,图神经网罗不错将用户、音乐神色以及它们之间的交互关系暗意为一个图,进而进行特征学习和保举。
然则,刻下基于图神经网罗的音乐保举模子在团聚模式上存在一定的局限性,无数模子仅仅通俗地相加或拼接节点特征 [6] [7] ,忽略了节点自身与邻域的权重分拨,导致团聚模式对节点特征的各异性挖掘不及。因此,本文冷漠了一种基于加权团聚图神经网罗的音乐保举模子MGWA,通过引初学控机制动态地分拨节点自身偏激邻域的权重,更好地捕捉节点特征暗意。MGWA模子简略在团聚阶段生动地相宜不同的图结构和节点特征,从而提高保举的准确性和个性化进度。推行成果标明,咱们冷漠的模子在委果数据集上取得了显赫的性能升迁,诠释了其在音乐保举边界的潜在应用价值。
本文的其余部分结构安排如下:第2节先容了关系责任;第3节注视叙述了MGWA模子的假想与好意思满;第4节给出了推行成果和性能评估;临了,第5节对全文进行了回归和瞻望。
2. 关系责任
图神经网罗在保举系统中的应用是一个备受怜惜的谋划边界,先前的谋划依然诠释了图神经网罗在保举系统中具有很大的后劲 [4] 。图神经网罗简略更好地捕捉用户和神色之间的复杂关系,从而提高保举的准确性和个性化进度。图神经网罗通过愚弄图结构来建模用户和神色之间的关系,其中图的节点暗意用户或神色,边暗意它们之间的交互或关联。通过这种模式,图神经网罗不错更好地捕捉用户和神色之间的复杂关系,包括用户之间的雷同性、神色之间的雷同性以及用户和神色之间的交互模式。
在图神经网罗中,节点暗意学习是一个中枢问题,它触及怎么将用户和神色暗意为低维向量,以便进行保举。先前的谋划标明,图神经网罗不错通过学习节点暗意来好意思满更准确的保举。这时时触及将图神经网罗应用于暗意学习任务,通过在图上进行信息传播和团聚来丰富节点的暗意,从而捕捉用户和神色之间的复杂关系。愚弄图神经网罗来学惯用户和神色的暗意,从而好意思满个性化的保举 [8] 。通过在图上进行信息传播和团聚,图神经网罗不错更好地捕捉用户和神色之间的关系,好意思满更准确的保举。此外,谋划东谈主员将学问图谱和图神经网罗联结起来用于保举 [9] 。Wang等东谈主冷漠了保举系统的学问图卷积网罗模子 [7] ,该模子通过聘请性地和有偏地团聚邻域信息,将图神经网罗设施彭胀到学问图谱,简略学习学问图谱的结构信息和语义信息以及用户的个性化和潜在趣味。Chang等东谈主冷漠了一种基于图的搞定设施 [10] ,将松散的神色序列重新构造为精好意思的神色趣味图,该模子愚弄图神经网罗强大的智商,从嘈杂的用户行径序列中动态领悟和索取用户激活的中枢趣味。
3. 模子假想
在本节中,咱们将注视商议冷漠的模子,并注视先容了关系设施。
3.1. 记号界说
本文所使用的记号界说如下,在音乐保举场景中,咱们界说连结 U = { u 1 , u 2 , u 3 , ⋯ , u m } ,和 V = { v 1 , v 2 , v 3 , ⋯ , v n } ,分别代表用户和神色的连结,用户、神色交互矩阵 Y = { y u v | u ∈ U , v ∈ V } ,其中, y u v = 1 代表用户u和神色v之间存在交互行径,不然莫得交互行径。把柄交互矩阵Y,咱们不错构建可用的学问图 G ,它由海量的实体、关系构成实体三元组(h, r, t)。这里 h ∈ E , r ∈ R 和 t ∈ E 分别表见学问三元组的头部、关系和尾部, E 和 R 暗意KG中的实体和关系集。给定交互矩阵Y和学问图 G ,咱们的场地是预测用户u是否对他之前莫得交互的神色v具有潜在趣味。
3.2. 模子总体结构
图1. 模子总体结构
模子总体结构如图1所示,当先把柄用户神色交互的行径记载来构建学问图,然后图神经网罗通过逐层团聚邻域信息来丰富神色暗意和传播高阶信息,颠倒的,在团聚阶段,咱们对节点自身和其邻域接纳门控机制进行权重分拨,从而更好地捕捉节点特征暗意。
3.3. 学问图镶嵌
TransE是一种常用的学问图谱镶嵌设施 [11] ,用于将学问图中的实体和关系映射到低维一语气向量空间中。它的中枢想想是通过学习实体和关系之间的飘浮关系来进行学问图谱的建模。具体来说,关于学问图中的每个三元组(h, r, t),其中h和t分别暗意头实体和尾实体,r暗意它们之间的关系。TransE的场地是学习到一个映射函数,使得关于每个三元组(h, r, t),闲适h + r ≈ t,其中 + 暗意向量的加法。换句话说,TransE但愿通过学习实体和关系的向量暗意,使得头实体、关系和尾实体之间的关系不错在向量空间顶用通俗的平移来暗意。
具体的历练历程是通过最大化正向三元组得分和最小化负向三元组得分来好意思满的。关于每个正向三元组(h, r, t),通过忖度h + r 和t的距离,得到一个得分,使得正向三元组的得分尽可能小;同期,关于每个负向三元组(h, r, t'),其中t'暗意一个乌有的尾实体,通过忖度h + r和t'的距离,得到一个得分,使得负向三元组的得分尽可能大。通过这种模式,不错学习到实体和关系的向量暗意,从而好意思满学问图谱的镶嵌。公式如下:
L = ∑ ( e h , e r , e t ) ∈ T ∑ ( e h ′ , e r ′ , e t ′ ) ∈ T max ( [ γ + ε ( e h , e r , e t ) − ε ( e h ′ , e r ′ , e t ′ ) ] , 0 ) (1)
其中, e h , e r , e t 分别代表头部实体、关系和尾部实体的向量暗意。 E ( e h , e r , e t ) 为评分函数,界说如下:
E ( e h , e r , e t ) = ‖ e h + e r − e t ‖ (2)
通过历练场地函数,TransE不错将实体和关系映射到一个低维向量空间,在这个空间中,雷同的实体和关系愈加接近。
3.4. 偏好传播
在获取实体和关系的镶嵌后,咱们需要忖度它的邻域镶嵌。实体和关系的镶嵌不错通过学问图镶嵌得到,邻域镶嵌是实体的邻域镶嵌的线性组合。为了分离不同邻居的进击性,在忖度邻居的线性组合时,咱们使用归一化的进击性分数算作邻居镶嵌的权重。因此,邻域镶嵌的忖度公式如下:
e N ( v ) = ∑ a ∈ N ( v ) s ˜ r v , a u e a (3)
其中 s ˜ r v , a u 是归一化的进击性分数, r v , a 暗意实体v与其邻居a的关系,N(v)暗意实体v的邻居连结,归一化公式如下:
s ˜ r v , a u = exp ( s r v , a u ) ∑ a ∈ N ( v ) exp ( s r v , a u ) (4)
其中,忖度邻居进击性得分公式如下:
s r u = σ ( e u T e r ) (5)
在学问图谱中,用户的偏好信息和会过实体和关系之间的连结传播到其他关系实体上,在偏好传播的每一层中,通过邻居实体的迭代团聚来更新边界镶嵌暗意,公式如下:
e N ( v ) [ h − 1 ] = ∑ a ∈ N ( v ) s ˜ r v , a u e a [ h − 1 ] (6)
3.5. 加权团聚
咱们通过图神经网罗将实体暗意 e v 偏激邻域暗意 e N ( v ) 团聚到单个向量中。这里咱们使用的团聚模式是通过门控机制来截至实体本人的镶嵌与其相邻的镶嵌的权重,从而把柄具体的节点和邻居节点的特征动态地分拨权重。门控卷积网罗是由Dauphin等东谈主冷漠的一个模子 [12] ,用于截至应该传播哪些信息以预测谈话建模任务中的下一个单词,在这里,咱们接纳近似的计谋来聘请哪些特征用于预测与将来神色关系的特征。原论文中的公式如下:
z = ( X ∗ W + b ) ⊗ σ ( X ∗ V + c ) (7)
其中,X代表输入,W、V、b、c是可学习的参数, σ 是sigmoid函数, ∗ 代表卷积运算, ⊗ 代表矩阵之间的逐元素乘积。
为了减少可学习参数的数目,咱们在原始的门控卷积网罗中应用内积而不是卷积操作,咱们的输入是节点自身镶嵌偏激邻域镶嵌暗意,修改后公式如下:
z = ( { e v , e N ( v ) } ⋅ W + b ) ⊗ σ ( { e v , e N ( v ) } ⋅ V + c ) (8)
因此,门控机制单层团聚的公式如下:
e v [ 1 ] = ( { e v [ 0 ] , e N ( v ) [ 0 ] } ⋅ W + b ) ⊗ σ ( { e v [ 0 ] , e N ( v ) [ 0 ] } ⋅ V + c ) (9)
以上是一层团聚的情况。此时, e v [ 0 ] = e v , e N ( v ) [ 0 ] = e N ( v ) 。 e v [ 1 ] ,是一次迭代的成果。假定迭代层数为n,实体v的最终团聚暗意为 e v [ N ] ,公式如下:
e v [ N ] = ( { e v [ N − 1 ] , e N ( v ) [ N − 1 ] } ⋅ W + b ) ⊗ σ ( { e v [ N − 1 ] , e N ( v ) [ N − 1 ] } ⋅ V + c ) (10)
3.6. 评分预测
最终的n阶实体暗意暗意为 e v [ N ] ,它与用户暗意 e u 全部被送入函数 f : R d × R d → R ,用于预测点击概率:
y ^ = f ( e v [ N ] T e u ) (11)
y ^ 暗意用户收听音乐的预测概率。
3.7. 模子历练
咱们使用时辰反向传播算法来历练MGWA模子,历练集、评估集和测试集的比例为6:2:2。所有参数齐不错通过反向传播的梯度下落来忖度。
4. 推行成果及分析
这部分是注认识推行假想,包括数据集、推行基准模子、评价筹办和推行成果对比分析。
4.1. 数据集
表1. 数据集的基本信息统计
Last.FM包含来自Last.fm在线音乐系统的1872个用户的音乐家收听信息。数据集的学问图谱是由微软Satori构建的,况且只保留置信度大于0.9的通盘KG三元组。推行数据集的统计数据回归在表1中。
4.2. 推行基准模子
RippleNet [6] :这种设施愚弄学问图谱信息,以用户的历史神色为种子,在学问图中的旅途上迭代的传播用户对实体集的偏好,临了通过相加每一层神色反映来团聚用户偏好。
KGCN [7] :冷漠了一种联结学问图和图卷积神经网罗特色的模子,该模子基于神色传播信息的多跳邻域性质,获取增强的神色暗意,临了通过通俗拼接或相加来团聚神色自身与其邻域的镶嵌暗意。
4.3. 评价筹办
为了评估咱们模子的性能,咱们使用AUC、ACC和F1算作度量,AUC是指ROC弧线下的面积。ROC弧线是由TPR算作纵坐标和FPR算作横坐标酿成的弧线。ACC暗意正确预测的样本数与样本总和的比率。F1评分是对查准率和查全率的概述评价,公式如下:
F 1 = 2 ∗ recall ∗ precision recall + precision (12)
4.4. 推行成果对比分析
为了考据咱们构建的模子的灵验性,咱们将冷漠的模子MGWA与经典基线进行了比拟。保举任务的推行成果见表2。
表2. 模子MGWA和基线的对比
咱们不错不雅察到,模子MGWA在所有评估建立中具有最好性能。这标明了咱们的模子接纳加权团聚的设施的灵验性。咱们的模子优于RippleNet模子,是因为RippleNet模子未辩论学问图谱中的实体权重,从而未将保举重心放在进击进度较高的实体上。咱们的模子推崇优于KGCN模子,是因为KGCN模子在团聚时接纳的设施是通俗的相加和拼接,忽略了节点自身的进击性,从而影响保举准确率。
5. 回归和瞻望
本文冷漠了一种基于加权团聚图神经网罗的音乐保举模子MGWA,通过引初学控机制动态地分拨节点自身偏激邻域的权重,从而更好地捕捉节点特征暗意。推行成果标明,所冷漠的模子在委果数据集上取得了显赫的性能升迁,这诠释了加权团聚的灵验性和门控机制的生动性和可学习性。将来,咱们不错进一步探索模子的彭胀性和泛化智商,尝试在更大边界的数据集上进行考据,同期也不错辩论将该模子应用到其他边界的保举系统中,以期获取更等闲的应用和影响。
著作援用
肖 涵,孙德志,游福成. 基于加权团聚图神经网罗的音乐保举模子Music Recommendation Model Based on Graph Neural Network with Weighted Aggregation[J]. 软件工程与应用, 2024, 13(01): 101-107. https://doi.org/10.12677/SEA.2024.131010
参考文件