冷启问题目前常见解决方案

news/2024/5/19 20:54:09 标签: 人工智能, 推荐算法

1、冷启动的基本方式

随机冷启

个性化冷启

2、冷启动解决问题

冷启动保量

冷启动保量,保证每个item曝光的次数一样,实时统计已曝光的次数和要曝光的次数

冷启动结束过滤,如果需曝光的量越大,且越接近冷启结束时间,得分越高,被曝光的概率越大

爬坡保量

实时统计曝光、点击、ctr;ctr越高,曝光越少,得分越高;类似于bandit

3、冷启动实现算法

3.1、MAB问题介绍

MAB(Multi-Arm-Bandit)是多臂赌博机问题,是RL(强化学习)的一种。主要解决的是EE(exploit and explore)问题,exploit表示利用已有的确定兴趣,explore表示探索未知的兴趣。

MAB问题:有K个老虎机,总共摇T次,怎样使T次后的总收益最大的问题。

3.2、冷启问题解决算法

epsilon-Greedy贪婪算法

以epsilon的概率选择探索新的策略、以(1-epsilon)选择利用的操作

epsilon-Greedy-softmax贪婪算法

完全随机选择一个item 进行exploit会导致选的一个非常差的item,利用softmax函数决策选择一个回报率最大的item。

ucb算法

根据下列公式每个臂都摇一次

t表示当前实验的总次数,表示该臂被选中的次数,第二项是explore,优先选择历史被选中次数少的臂。

4、多臂赌博机的应用

多臂老虎机是指,每个老虎机盈利概率不一样,每次摇臂有k种选择。为实现t次摇臂获取最大的收益率

 

星际比赛游戏

在星际争霸比赛中,很多bot都会针对特定的对手设置一些初始策略,在每一轮游戏结束之后,并会记录基于此初始策略的游戏结果,新一轮比赛开始前,bot会根据与对手比赛的历史记录,试图选择一个最优的初始策略来击败对方,以Overkill为例,Overkill中开局策略有三种(TwelveHatchMuta,TenHatchMuta, NinePoolling)。Overkill每局结束以后均会记录当前局所采用开局策略的结果,比如Overkill与cpac对战六局,记录结果如下

cpac|TenHatchMuta|0|

cpac|NinePoolling|1|

capa|TwelveHatchMuta|1|

cpac|NinePoolling|1|

cpac|TwelveHatchMuta|1|

cpac|NinePoolling|1|

"0"表示对应开局策略cpac赢,“1”表示Overkill赢。

5、参考文献

专治选择困难症——bandit算法 - 知乎 (传统冷启方法)

UCB算法原理及其在星际争霸比赛中的应用 - 知乎 (冷启问题的应用)

大数定律与中心极限定理 (中心极限定理)


http://www.niftyadmin.cn/n/4977126.html

相关文章

Linux用户与组管理(01)(六)

目录 前言 一、用户管理 1、 概述 2、用户操作 总结 前言 今天学习的是新知识,Linux用户与组管理,刚开始就是简单的一些概念、命令等,今天学习的内容也都是重点哦!希望我们可以一起学习,共同发展和进步。 提示&#x…

研磨设计模式day14模板方法模式

目录 场景 原有逻辑 有何问题 解决方案 解决思路 代码实现 重写示例 模板方法的优缺点 模板方法的本质 何时选用 场景 现在模拟一个场景,两个人要登录一个系统,一个是管理员一个是用户,这两个不同身份的登录是由后端对应的两个接…

【80天学习完《深入理解计算机系统》】第十天 3.3 条件码寄存器【CF ZF SF OF】【set】

专注 效率 记忆 预习 笔记 复习 做题 欢迎观看我的博客,如有问题交流,欢迎评论区留言,一定尽快回复!(大家可以去看我的专栏,是所有文章的目录)   文章字体风格: 红色文字表示&#…

leetcode.105 从前序和中序遍历序列构造二叉树

题目描述&#xff1a; 给定两个整数数组 preorder 和 inorder &#xff0c;其中 preorder 是二叉树的先序遍历&#xff0c; inorder 是同一 棵树的中序遍历&#xff0c;请构造二叉树并返回其根节点。 题目要求&#xff1a; 1 < preorder.length < 3000inorder.length…

Yolo系列-yolov3

YOLO-V3 这张图讲道理真的过分了&#xff01;&#xff01;&#xff01;我不是针对谁&#xff0c;在座的各位都是 终于到V3了&#xff0c;最大的改进就是网络结构&#xff0c;使其更适合小目标检测特征做的更细致&#xff0c;融入多持续特征图信息来预测不同规格物体 先验框更丰…

RNA 35. SCI 文章基于RNA-seq推断CNVs (RNAseqCNV)

转录组生信分析教程 桓峰基因公众号推出转录组分析教程&#xff0c;有需要生信的老师可以联系我们&#xff01;转录分析教程整理如下&#xff1a; RNA 1. 基因表达那些事--基于 GEO RNA 2. SCI文章中基于GEO的差异表达基因之 limma RNA 3. SCI 文章中基于T CGA 差异表达基因之 …

谷歌浏览器的受欢迎之谜:探析其引人入胜的特点

文章目录 &#x1f340;引言&#x1f340;1. 极速的浏览体验&#x1f340;2. 简洁直观的界面&#x1f340;3. 强大的同步功能&#x1f340;4. 丰富的扩展生态系统&#x1f340;5. 安全与隐私的关注&#x1f340;6. 持续的技术创新&#x1f340;7. 跨平台支持和云整合&#x1f3…

nginx-获取客户端IP地址

上有服务器与客户端中间是有nginx代理服务器的&#xff0c;上游服务器如何获取客户端真实ip地址&#xff1f; nginx代理服务器设置X-Forwarded-For的header参数&#xff0c;代理服务器通过remote_addr获取客户端ip地址&#xff0c;将ip地址写入nginx代理服务器的X-Forwarded-Fo…