多目标loss平衡和多目标融合推理

多目标loss平衡:

优化方法更多的考虑的是在已有结构下,更好地结合任务进行训练和参数优化,它从Loss与梯度的维度去思考不同任务之间的关系。在优化过程中缓解梯度冲突,参数撕扯,尽量达到多任务的平衡优化。

  • GradNorm 尝试将不同任务的梯度调节到相似的量级来控制多任务网络的训练,以鼓励网络以尽可能相同的速度学习所有任务。

  • DWA 它也通过考虑每个任务的损失改变,去学习平均不同训练轮数下各任务的权重。

多目标融合推理

为了建模用户的满意度,我们会对多个隐式、显式目标进行预估,如点击率、有效播放率、播放时长、点赞率、关注率等。最终用统一的融合公式将预估值合成一个排序分。

  1. 线性加权 score=\sum_{i=1}^n\alpha_i*ctr_i

  2. 指数加权 score=\prod_{i=1}^n ctr_i^{\alpha_{i}}

  3. 带权指数加法 score=\sum_{i=1}^n(\alpha_i+ctr_i)^{\beta_i}

  4. 带权指数乘法 score=\prod_{i=1}^n(\alpha_i+ctr_i)^{\beta_i}

  5. 强化搜参:把线上流量分成一些小的流量池,通过一些线上当前的参数,去生成一些新的参数,去看用户对这些参数的反应,收集反馈进行迭代。


http://www.niftyadmin.cn/n/5313042.html

相关文章

Python print 高阶玩法

Python print 高阶玩法 当涉及到在Python中使用print函数时,有许多方式可以玩转文本样式、字体和颜色。在此将深入探讨这些主题,并介绍一些print函数的高级用法。 1. 基本的文本样式与颜色设置 使用ANSI转义码 ANSI转义码是一种用于在终端&#xff0…

蓝牙midi和蓝牙音频或者蓝牙audio有什么区别呢

一、简介 蓝牙midi和蓝牙音频或者蓝牙audio有什么区别呢 首先这里分为三个概念,也就是什么是蓝牙?什么是蓝牙midi?什么是蓝牙音频audio? 1、什么是蓝牙,这个就不用赘述了,大家都懂 2、什么是蓝牙midi&a…

什么是GeoTrust证书?

GeoTrust是全球知名的数字证书颁发机构,提供一系列安全解决方案,旨在帮助客户保护敏感数据并验证在线身份。其证书广泛应用于各类网站,为企业和个人提供安全保障。 GeoTrust证书受到欢迎的原因主要有以下几点: 快速部署&#xff…

Mysql InnoDB行锁深入理解

Record Lock记录锁 Record Lock 称为记录锁,锁住的是一条记录。而且记录锁是有 S 锁和 X 锁之分的: 当一个事务对一条记录加了 S 型记录锁后,其他事务也可以继续对该记录加 S 型记录锁(S 型与 S 锁兼容),…

有趣的前端知识(二)

推荐阅读 智能化校园:深入探讨云端管理系统设计与实现(一) 智能化校园:深入探讨云端管理系统设计与实现(二) 文章目录 推荐阅读HTML元素元素属性头部元素列表元素区块元素表单元素 颜色字符实体 HTML元素 …

无法自动装配。找不到 ‘RabbitTemplate‘ 类型的 Bean

解决方案&#xff1a;把这个项目的spring-rabbit依赖的<scope>test</scope>删除并重新加载maven

知识图谱gds使用记录

安装 从下载站下载对应的包到plugin目录下&#xff0c;修改配置文件/etc/neo4j/neo4j.conf&#xff0c;末尾加入gds.*&#xff0c;重新启动 在浏览器输入CALL gds.list()命令进行测试 建立图映射 为了使用图算法&#xff0c;需要先将图数据库的内容映射为一个新图 如果是全…