[TOC]
-
已支持模型
模型 模型类型 deepwalk 图模型 eges 图模型 unsup_graphsage 图模型 sup_graphsage 图模型 semisup_graphsage 图模型 unsup_bipartite_graphsage 图模型 bipartite_plnlp 图模型 cmv 图模型 deep_graph_infomax 图模型 deep_graph_contrastive 图模型 node_infograph 图模型 deepfm 排序模型 deepfm2 排序模型 din 排序模型 youtubednn 召回模型 dssm 召回模型 self-training dssm 召回模型 graphdeepfm 图排序模型 graphdssm 图召回模型 ... ...
-
机器配置
- Intel(R) Xeon(R) Platinum 8255C CPU @ 2.50GHz
- 内存 256GB
-
软件版本
- Tencent tlinux release 2.2
- gcc (GCC) 4.8.5
- Python 3.7.10
- scikit-learn 1.0
-
参数设置与论文基本保持一致
- 参考demo/single目录下对应模型脚本
- 所有评测均使用 8 个线程
-
对于 业界已有模型
- 有公开数据集,给出公开数据集上的评测效果和效率
- 没有公开数据集,给出业务数据集上相对提升
-
对于 自研模型
- 有公开数据集,给出公开数据集上的评测效果和效率
- 没有公开数据集,阐述建模思路并给出业务数据集上相对提升
以下依次介绍 图模型
、深度模型
和 图与深度学习的联合建模模型
效果与效率的评测。
-
blogcatalog 数据集
- 链接:http://leitang.net/code/social-dimension/data/blogcatalog.mat
- 包含 10,312 个节点,667,966 条边,39 个标签
-
ppi 数据集
- 链接:http://snap.stanford.edu/graphsage/ppi.zip
- 包含 56,944 个节点,1,612,348 条边,121 个标签
-
cora 数据集
- 链接:https://linqs-data.soe.ucsc.edu/public/lbc/cora.tgz
- 包含 2,708 个节点,10,556 条边,7 个标签
-
业界已有模型
模型 数据集 耗时(秒) micro-F1 deepwalk blogcatalog 175 0.408 eges ppi 154 0.431 unsup_graphsage ppi 332 0.510 sup_graphsage ppi 19 0.612 cmv cora 83 0.763 deep_graph_infomax cora 34 0.721 deep_graph_contrastive cora 115 0.757 node_infograph cora 123 0.856 -
自研模型
-
unsup_bipartite_graphsage
- 在 unsup_graphsage 基础上从同构图扩展到二部图
- 节点根据类型使用不同编码器编码,增强异构表达能力
-
semisup_graphsage
- 联合训练有监督与无监督目标
- 有监督,利用少量的标签数据,学习业务的目标
- 无监督,利用大量无标签数据,学习节点相似性
-
bipartite_plnlp
- 将自研的图链接预测自监督同构图算法pairwise learning for neural link prediction (https://arxiv.org/abs/2112.02936) 扩展到二部图
- 节点根据类型使用不同编码器编码,增强异构表达能力
- 通过pairwise learning提升模型的链接预测能力
- 能够直接应用于链接预测任务,也可以自监督学习生成二部图的节点embedding
-
-
avazu 数据集
-
criteo 数据集
-
业界已有模型
模型 数据集 耗时(分钟) auc deepfm avazu 8 0.749 deepfm criteo 16 0.801
- 没有公开数据集(若有,以后补充),使用业务数据集
-
业界已有模型
模型 数据集 耗时(分钟) hitrate youtubednn 内部 60 分钟 0.13 dssm 内部 60 分钟 0.19 -
自研模型
-
self-training dssm
- 通过构造补充正例,增强对长尾 item 的召回能力
- 相比于 dssm,hitrate + 1.3%
-
-
常用排序或者召回模型没法直接使用用户行为图数据,需要使用两阶段方案
- 图模型中,首先训练 embedding,然后加入排序或者召回模型作为特征使用
- 两阶段方案达不到预期的业务效果
我们通过联合建模的方案来解决这个问题,以 graph_deepfm 和 graph_dssm 为例讲述。
-
图模型学习 user embedding 加入 deepfm 模型侧,联合训练
-
对比 deepfm 与 graphdeepfm 的效果
模型 auc deepfm - graph_deepfm + 0.346%
-
user 侧引入 graph 信息,graph 与 dssm 模型
-
对比 dssm 与 graphdssm 的效果
模型 hitrate dssm - graph_dssm + 2.63%