一句话描述论文
- Invariant Representation Learning for Multimedia Recommendation, MM2022.[(du2022invariant)]
通过分析用户与物品间的虚假关联与固有联系,构造影响到用户喜好的物品不变特征,为多媒体推荐提供更为准确的偏好表征。
- How to Learn Item Representation for Cold-Start Multimedia Recommendation?, MM2020.[(du2020how)]
针对多媒体推荐中常遇到的冷启动项目与热启动项目表征不可比问题,构造反事实学习框架,将冷启动项目表征引入到训练过程中,从而建立热启动与冷启动物品间的关联,更好的实现个性化排序。
- Modeling Embedding Dimension Correlations via Convolutional Neural Collaborative Filtering, TOIS 2019.[(du2019modeling)]
通过外积建模嵌入表征维度间的相关性,形成高阶表征关联的特征图,并设计基于卷积神经网络的推荐模型,改善神经网络推荐模型的过拟合问题。
- Fast Matrix Factorization with Non-Uniform Weights on Missing Data, TNNLS 2019.[(he2019fast)]
为未观测数据加权,改良推荐效果,并深度剖析其矩阵分解过程,设计快速优化算法。
- Progressive Image Enhancement under Aesthetic Guidance, ICMR 2019.[(du2019progressive)]
通过即插即用网络协同模式,使用美学模型引导常规图像增强算法,实现过程可解释的全自动图像增强模型。
- Adversarial Training Towards Robust Multimedia Recommender System, TKDE 2019.[(tang2019adversarial)]
在多媒体推荐中引入对抗训练机制,增强模型的鲁棒性。
- Wheel: Accelerating CNNs with Distributed GPUs via Hybrid Parallelism and Alternate Strategy, MM 2017.[(du2017wheel)]
通过解析卷积神经网络的数据和参数架构,设计在普通实验室环境(千兆网络,多台服务器)下的分布式神经网络自动部署和高效运行方案,缓解海量参数和数据共享产生的带宽瓶颈。
以下是kimi自动生成的
以下我会给出八篇文章,请帮我从网上找到文章的介绍,为每篇文章形成不超过两句话的总结,描述清楚文章的主要内容。描述形式为:“针对。。。问题,提出了。。。方法。通过。。(具体技术)实现了。。。(效果)”。文章列表如下:
MultiCBR: Multi-view Contrastive Learning for Bundle Recommendation
Improving Global Generalization and Local Personalization for Federated Learning
Triplet Contrastive Representation Learning for Unsupervised Vehicle Re-identification
PTSR: Prefix-Target Graph-based Sequential Recommendation
Balancing visual context understanding in dialogue for image retrieval
MGNet: Learning Correspondences via Multiple Graphs
TrGa: Reconsidering the Application of Graph Neural Networks in Two-View Correspondence Pruning
Delving into Multimodal Prompting for Fine-grained Visual Classification
---
具体技术和效果稍微详细一些
针对的问题,有点太泛了。最好能够具体一些。例如:针对序列推荐中前缀与目标之间的关联关系建模不充分的问题,提出了。。
-
MultiCBR: Multi-view Contrastive Learning for Bundle Recommendation 针对捆绑推荐中用户、项目和捆绑之间的复杂关系建模问题,提出了MultiCBR方法。通过多视图对比学习框架,充分利用用户、捆绑和项目之间的关系信息,并通过图学习改善稀疏捆绑-项目关联信号的影响,实现了更好的表示学习和性能提升。
-
Improving Global Generalization and Local Personalization for Federated Learning 针对联邦学习中全局泛化和局部个性化难以平衡的问题,提出了pFedCSPC方法。通过跨客户端原型校准增强客户端知识一致性,采用自适应聚合方法为每个客户端提供个性化初始模型,并利用全局原型指导本地表示学习,有效缓解数据不平衡问题,提高全局模型泛化能力。
-
Triplet Contrastive Representation Learning for Unsupervised Vehicle Re-identification 针对无监督车辆重识别中部分特征和全局特征直接建模导致的梯度消失问题,提出了三元组对比表示学习框架TCRL。通过利用聚类特征桥接部分特征和全局特征,设计了三个记忆库存储实例/聚类特征,并提出了代理对比损失(PCL)进行相邻记忆库之间的对比学习,从而将部分与全局特征的关联表现为部分-聚类和聚类-全局关联的过渡。此外,TCRL提出了两种额外的损失函数来深入利用实例/聚类信息,实验结果表明TCRL在多个领域中提高了分类准确率。
-
PTSR: Prefix-Target Graph-based Sequential Recommendation 针对序列推荐中前缀与目标之间的关联关系建模不充分的问题,提出了PTSR方法。通过构建前缀-目标图(PTG)收集前缀和目标之间的观察相关性,并利用图神经网络来建模这些固有的相关性,从而改善预测模型中使用的物品表示,显著提高了不同数据集上的性能。
-
Balancing Visual Context Understanding in Dialogue for Image Retrieval 针对对话到图像检索中对话历史理解和跨模态匹配的挑战,提出了VCU框架。通过利用大型语言模型进行两步提取过程,生成与对话相关的精确图像描述,并利用与图像相关联的对象列表文本增强视觉表示,通过辅助查询集合平衡匹配过程,减少了相似性计算中的偏差,显著提高了对话到图像检索任务的性能。
-
MGNet: Learning Correspondences via Multiple Graphs 针对通过多个图学习对应关系的问题,提出了MGNet方法。MGNet通过构建多个图来学习图像间的对应关系,利用图卷积网络(GCN)在这些图上进行特征传播和聚合,以提高匹配的鲁棒性和准确性。
-
TrGa: Reconsidering the Application of Graph Neural Networks in Two-View Correspondence Pruning 针对两视图图像对应关系匹配中的剪枝问题,提出了TrGa方法。通过重新考虑图神经网络在两视图对应关系剪枝中的应用,TrGa方法通过构建多图结构并利用图神经网络捕捉局部和全局上下文信息,提高了对应关系匹配的准确性和效率。
-
Delving into Multimodal Prompting for Fine-grained Visual Classification 针对细粒度视觉分类中细微类别差异和大类内变异的挑战,提出了基于CLIP模型的多模态提示解决方案MP-FGVC。该方案包括子类别特定视觉提示(SsVP)和差异感知文本提示(DaTP),明确强调从输入角度的子类别特定差异,并通过视觉-语言融合模块(VLFM)实现跨模态协作推理,提高了细粒度视觉分类任务的性能。