推荐系统（1）——简介

推荐系统（1）——简介

news/2024/5/19 23:20:19 标签: 推荐算法, 机器学习

推荐系统：recommendation system

1 推荐系统背景

为了解决 信息过载 问题，在海量的数据中如何准确提供客户喜欢的内容。为了解决该问题，发展主要有三个阶段。

分类目录：1990s Hao 123 Yahoo
搜索引擎：2000s Google Baidu
推荐系统：2010s 不需要客户提供准确的信息，通过分析客户的历史行为来进行对用户的兴趣建模，从而提供客户满意的信息。

2 推荐和搜索的区别

搜索引擎：由用户主导，需要输入关键词，自行选择结果。如果结果不满意，需要修改关键词，再次搜索；注重搜索结果之间的关系和排序。
推荐系统：由系统主导，根据用户的浏览顺序，引导用户发现自己感兴趣的信息，需要研究用户的兴趣模型，利用社交网络的信息进行个性化的计算；

3 推荐系统的意义

主要有三个意义，分别从用户，内容提供者，平台

让用户更好的获取自己需要的内容
让内容更快更好的推动到适用人群
让平台跟有效的保留用户资源

在这里插入图片描述

4 推荐系统的应用

在这里插入图片描述

5 基本思想

知你所想，精准推送
利用用户和物品的特征信息，推荐具有这些特征的信息
物以类聚
利用用户喜欢的物品，推荐类似的物品
人以群分
利用和用户相似的其他用户，基于他们的特征进行推荐

6 数据源

三类数据源：用户，物品，行为数据

item数据：待推荐物品或内容的元数据，例如关键字，分类标签，基因描述等;
User 数据：用户的基本信息，例如性别，年龄，兴趣标签等；
行为数据：可以转化为对物品或者信息的偏好，根据应用本身的不同可能包括用户对物品的评分，用户查看物品的记录，用户的购买记录等。这些用户的偏好信息可以分为两类:
- 显式的用户反馈：用户在网站上显式的反馈信息，例如用户对物品的评分，对物品的评论。
- 隐式的用户反馈：用户在使用网站是产生的数据，隐式的反应了用户对物品的喜好，例如用户购买了某物品，用户查看了某物品的信息等等。

在这里插入图片描述

7 推荐系统的分类

1.根据实时性分类

离线推荐
实时推荐

2 是否个性化推荐

基于统计的
个性化推荐

3 根据推荐原则分类

基于相似度
基于知识
基于模型

4 根据数据源

基于人口统计学（用户信息）
基于内容的推荐（商品信息）
基于协同过滤的推荐（基于行为数据）

在这里插入图片描述
1.基于人口统计学：

在这里插入图片描述
2.基于内容（Content Based，CB）：

主要是利用用户评价过的物品内容的特征，CF还可以利用其他用户评价过的物品内容。

3.基于协同过滤：collaborative filtering，CF

基于近邻的协同过滤
- 基于用户（User-CF）
- 基于物品（Item-CF）
基于模型的协同过滤
- 奇异值分解（SVD）
- 潜在语义分解（LSA）
- 支持向量机（SVM）

4.混合推荐，就是集成学习（ensemble learning）

加权混合
对不同的推荐结果按照权重线性加权
切换混合
多套推荐机制，根据系统的不同情况选择最合适的推荐机制
分区混合
采用多种推荐机制，将不同的推荐结果推送到不同的用户
分层混合
采用多种推荐机制，将一个机制的推荐结果作为另外一个的输入，类似boosting，串行学习？？

下一篇：推荐系统（2）——评测指标

http://www.niftyadmin.cn/n/948402.html

相关文章

推荐系统（2）——评测指标

推荐系统（2）——评测指标

根据评测体系来评价一个推荐系统的好坏，由于推荐系统是和实际收益挂钩，所以需要考虑三方（用户，物品提供者和平台）的利益，实现最大化的三方共赢。接下来从实验方法，评测指标和评测维度\red{实验…

阅读更多...

推荐系统（4）——推荐算法1(基于内容和协同过滤)

推荐系统（4）——推荐算法1(基于内容和协同过滤)

文章目录1 基于内容的推荐（Content Based）1.1 原理1.2 算法流程1.3 优/缺点2 协同过滤（Collaborative Filtering）2.1 CF的理论基础（1）U-U矩阵相似度计算（Pearson系数）（2&…

阅读更多...

推荐系统（3）——个性化推荐系统架构

推荐系统（3）——个性化推荐系统架构

关于推荐系统的技术架构，我认为应该是作为一个初学者首先需要认识的。 1 推荐系统架构图——baseline4 根据以上的很简单的架构图可以看出，一个推荐系统可以概括为f(U,I,C)f(U, I, C)f(U,I,C)：基于用户(User)物品(Item)场景(Context)信息&a…

阅读更多...

常用损失函数及其应用场景

常用损失函数及其应用场景

文章目录1 Regression1.1 均方误差（MSE）/L2损失1.2 均方根误差（root mean suqare error,RMSE）1.3 平均绝对误差MAE/L1损失1.4 平均偏差误差（Mean Bias Error）1.5 平均绝对百分比误差（Mean Absol…

阅读更多...

推荐系统（5）——推荐算法2（POLY2-FM-FFM-GBDT-MLR）

推荐系统（5）——推荐算法2（POLY2-FM-FFM-GBDT-MLR）

文章目录1 CTR简介2 逻辑回归——融合多种特征的推荐模型2.1 基于逻辑回归的推荐流程2.2 LR的数学形式2.3 逻辑回归在推荐上的优劣分析3 从FM到FFM——特征自动交叉的解决方案3.1为什么需要特征交叉？——辛普森悖论3.2 POLY2模型——特征交叉的开始3.3 什么是FM1 从…

阅读更多...

GBDT和xgboost原理、比较分析、面试总结

GBDT和xgboost原理、比较分析、面试总结

在介绍（Gradient Boosting Decesion Tree，GBDT）之前，需要先引入一些基础知识，从前向分步算法到梯度提升算法（Gradient Boosting） 文章目录1 前向分步（Forward Step）2 梯度…

阅读更多...

推荐系统（6）——推荐算法3（深度学习时代来临：AutoRec,Deep Crossing,NeuralCF,PNN,WideDeep,FNN,DeepFM,NFM）

推荐系统（6）——推荐算法3（深度学习时代来临：AutoRec,Deep Crossing,NeuralCF,PNN,WideDeep,FNN,DeepFM,NFM）

文章目录1 AutoRec——神经网络推荐算法的开端1.1 自编码器1.2 AutoRec模型结构1.3 AutoRec的推荐过程1.4 模型的特点和局限2 Deep Crossing——深度学习推荐算法的完整应用2.1 Deep Crossing的应用场景2.2 Deep Crossing的模型结构1 特征2 网络结构2.3 Deep Crossing的革命性意…

阅读更多...

softmax函数用于多分类问题的解读

softmax函数用于多分类问题的解读

在多分类问题中，我们常常使用softmax作为输出层函数。下面来介绍softmax函数。 1 softmax数学形式： 通过数学表达式，我们可以看到，softmax函数将向量映射为一个概率分布（0，1）对于n维向量最后映…

阅读更多...

最新文章