推荐系统(1)——简介

news/2024/5/19 23:20:19 标签: 推荐算法, 机器学习

推荐系统:recommendation system

1 推荐系统背景

为了解决 信息过载 问题,在海量的数据中如何准确提供客户喜欢的内容。为了解决该问题,发展主要有三个阶段。

  • 分类目录:1990s Hao 123 Yahoo
  • 搜索引擎:2000s Google Baidu
  • 推荐系统:2010s 不需要客户提供准确的信息,通过分析客户的历史行为来进行对用户的兴趣建模,从而提供客户满意的信息。

2 推荐和搜索的区别

  • 搜索引擎:由用户主导,需要输入关键词,自行选择结果。如果结果不满意,需要修改关键词,再次搜索;注重搜索结果之间的关系和排序。
  • 推荐系统:由系统主导,根据用户的浏览顺序,引导用户发现自己感兴趣的信息,需要研究用户的兴趣模型,利用社交网络的信息进行个性化的计算;

3 推荐系统的意义

主要有三个意义,分别从用户,内容提供者,平台

  • 让用户更好的获取自己需要的内容
  • 让内容更快更好的推动到适用人群
  • 让平台跟有效的保留用户资源

在这里插入图片描述

4 推荐系统的应用

在这里插入图片描述

5 基本思想

  • 知你所想,精准推送
    利用用户和物品的特征信息,推荐具有这些特征的信息
  • 物以类聚
    利用用户喜欢的物品,推荐类似的物品
  • 人以群分
    利用和用户相似的其他用户,基于他们的特征进行推荐

6 数据源

三类数据源: 用户,物品,行为数据

  • item数据:待推荐物品或内容的元数据,例如关键字,分类标签,基因描述等;

  • User 数据:用户的基本信息,例如性别,年龄,兴趣标签等;

  • 行为数据:可以转化为对物品或者信息的偏好,根据应用本身的不同可能包括用户对物品的评分,用户查看物品的记录,用户的购买记录等。这些用户的偏好信息可以分为两类:

    • 显式的用户反馈:用户在网站上显式的反馈信息,例如用户对物品的评分,对物品的评论
    • 隐式的用户反馈:用户在使用网站是产生的数据,隐式的反应了用户对物品的喜好,例如用户购买了某物品,用户查看了某物品的信息等等。

在这里插入图片描述

7 推荐系统的分类

1.根据实时性分类

  • 离线推荐
  • 实时推荐

2 是否个性化推荐

  • 基于统计的
  • 个性化推荐

3 根据推荐原则分类

  • 基于相似度
  • 基于知识
  • 基于模型

4 根据数据源

  • 基于人口统计学(用户信息)
  • 基于内容的推荐(商品信息)
  • 基于协同过滤的推荐 (基于行为数据)

在这里插入图片描述
1.基于人口统计学:

在这里插入图片描述
2.基于内容(Content Based,CB):

主要是利用用户评价过的物品内容的特征,CF还可以利用其他用户评价过的物品内容。

3.基于协同过滤:collaborative filtering,CF

  • 基于近邻的协同过滤
    • 基于用户(User-CF)
    • 基于物品(Item-CF)
  • 基于模型的协同过滤
    • 奇异值分解(SVD)
    • 潜在语义分解(LSA)
    • 支持向量机(SVM)

4.混合推荐,就是集成学习(ensemble learning)

  • 加权混合
    对不同的推荐结果按照权重线性加权
  • 切换混合
    多套推荐机制,根据系统的不同情况选择最合适的推荐机制
  • 分区混合
    采用多种推荐机制,将不同的推荐结果推送到不同的用户
  • 分层混合
    采用多种推荐机制,将一个机制的推荐结果作为另外一个的输入,类似boosting,串行学习??

下一篇:推荐系统(2)——评测指标


http://www.niftyadmin.cn/n/948402.html

相关文章

推荐系统(2)——评测指标

根据评测体系来评价一个推荐系统的好坏,由于推荐系统是和实际收益挂钩,所以需要考虑三方(用户,物品提供者和平台)的利益,实现最大化的三方共赢。 接下来从实验方法,评测指标和评测维度\red{实验…

推荐系统(4)——推荐算法1(基于内容和协同过滤)

文章目录1 基于内容的推荐(Content Based)1.1 原理1.2 算法流程1.3 优/缺点2 协同过滤(Collaborative Filtering)2.1 CF的理论基础(1)U-U矩阵相似度计算(Pearson系数)(2&…

推荐系统(3)——个性化推荐系统架构

关于推荐系统的技术架构,我认为应该是作为一个初学者首先需要认识的。 1 推荐系统架构图——baseline4 根据以上的很简单的架构图可以看出,一个推荐系统可以概括为f(U,I,C)f(U, I, C)f(U,I,C):基于用户(User)物品(Item)场景(Context)信息&a…

常用损失函数及其应用场景

文章目录1 Regression1.1 均方误差(MSE)/L2损失1.2 均方根误差(root mean suqare error,RMSE)1.3 平均绝对误差MAE/L1损失1.4 平均偏差误差(Mean Bias Error)1.5 平均绝对百分比误差(Mean Absol…

推荐系统(5)——推荐算法2(POLY2-FM-FFM-GBDT-MLR)

文章目录1 CTR简介2 逻辑回归——融合多种特征的推荐模型2.1 基于逻辑回归的推荐流程2.2 LR的数学形式2.3 逻辑回归在推荐上的优劣分析3 从FM到FFM——特征自动交叉的解决方案3.1为什么需要特征交叉?——辛普森悖论3.2 POLY2模型——特征交叉的开始3.3 什么是FM1 从…

GBDT和xgboost原理、比较分析、面试总结

在介绍(Gradient Boosting Decesion Tree,GBDT)之前,需要先引入一些基础知识,从前向分步算法到梯度提升算法(Gradient Boosting) 文章目录1 前向分步(Forward Step)2 梯度…

推荐系统(6)——推荐算法3(深度学习时代来临:AutoRec,Deep Crossing,NeuralCF,PNN,WideDeep,FNN,DeepFM,NFM)

文章目录1 AutoRec——神经网络推荐算法的开端1.1 自编码器1.2 AutoRec模型结构1.3 AutoRec的推荐过程1.4 模型的特点和局限2 Deep Crossing——深度学习推荐算法的完整应用2.1 Deep Crossing的应用场景2.2 Deep Crossing的模型结构1 特征2 网络结构2.3 Deep Crossing的革命性意…

softmax函数用于多分类问题的解读

在多分类问题中,我们常常使用softmax作为输出层函数。下面来介绍softmax函数。 1 softmax数学形式: 通过数学表达式,我们可以看到,softmax函数将向量映射为一个概率分布(0,1)对于n维向量最后映…