Java推荐算法——特征加权推荐算法(以申请学校为例)

news/2024/5/20 0:10:26 标签: java, 推荐算法, python

加权推荐算法

文章目录


1.推荐算法的简单介绍

众所周知,推荐算法有很多种,例如:

1.加权推荐:分为简单的特征加权,以及复杂的混合加权。主要是将特征以权重进行计算总和,排序出前几名的数据,即最符合条件的数据,推荐给用户。

2.内容基推荐:这种方法基于物品的特征。系统会分析用户过去喜欢的物品特征,然后找到具有类似特征的其他物品推荐给用户。这种方法依赖于对物品内容的深入理解,比如文本、图像或音频特征。

比如我想买【华为手机】,但是系统中关于华为手机的商品很少,在用户继续浏览的过程中,就会根据华为手机属于【手机】类的这个特征,推荐其他【手机】类型的商品。

3.协同过滤推荐:分为物品基协同过滤用户基协同过滤
简单描述一下【用户基协同过滤】。
如果一个用户A喜欢某个物品,那么这个系统会找到与用户A相似的其他用户B,然后将B喜欢的、A还未接触的物品推荐给A。

2.加权推荐算法详细介绍

本次探讨的就是简单的特征加权,以留学申请为例简单描述一下:
比如留学申请的过程中中有几个重要特征参数:所在国家、全球QS排名、专业。
那么当我想选择:{英国,前10,计算机}这样的数据时,一般会怎么查呢?是不是精确查询了?在数据库中找到英国+QS前10+计算机这样的数据返回给用户。
在这里插入图片描述

但是在面对数据较少的时候,显示给用户的数据就太少了,比如我上面展示的,只有2条数据符合要求。
那如果我想每次用户搜索完成后,最少都要展示10条数据呢?
这样就需要在精确搜索进行改进了,改为【特征加权推荐】,以国家、专业、QS排名三个为特征,设置权重,对数据库中的数据进行计算,获取前10个得分最高的数据展示。

这样就可以推荐出用户也“可能”喜欢的院校了,比如就推荐出了美国高校的计算机专业。
在这里插入图片描述

3.代码实现

实现代码示例如下:
加权推荐的算法部分
首先我们需要准备留学专业java实体类。

java">package com.ride.system.domain;

import org.apache.commons.lang3.builder.ToStringBuilder;
import org.apache.commons.lang3.builder.ToStringStyle;
import com.ride.system.common.core.domain.BaseEntity;

/**
 * 留学专业信息对象 sys_study_abroad
 *
 */
public class SysStudyAbroad extends BaseEntity
{
    private static final long serialVersionUID = 1L;

    /** 主键 */
    private Long studyAbroadId;

    /** 国家 */
    private String country;

	/** 专业 */
    private String major;
    
	/** QS排名 */
    private String qs;

    // 推荐加权得分
    private Double score;

    public Double getScore() {
        return score;
    }

    public void setScore(Double score) {
        this.score = score;
    }

    public String getQs() {
        return qs;
    }

    public void setQs(String qs) {
        this.qs = qs;
    }

    public String getCountry() {
        return country;
    }

    public void setCountry(String country) {
        this.country = country;
    }

    public SysMajor getMajor() {
        return major;
    }

    public void setMajor(SysMajor major) {
        this.major = major;
    }
}

接下来,编写推荐算法的函数

java">/**
 * 加权平均推荐算法
 * @param userInput 用户输入
 * @param majors 留学专业列表,即数据库中全部专业数据
 * @param weights 权重规则
 * @return
 */
public static List<SysStudyAbroad> weightedRecommendation(SysStudyAbroad userInput, List<SysStudyAbroad> majors, Map<String, Double> weights) {
    List<SysStudyAbroad> recommendations = new ArrayList<>();

    for (SysStudyAbroad major : majors) {
        double score = 0;

        // 计算每个权重的得分
        // 如果满足一个要求,则得1分,否则0分。
        double countrySimilarity = userInput.getCountry().equals(major.getCountry()) ? 1 : 0;
        double majorSimilarity = userInput.getMajor().equals(major.getMajor()) ? 1 : 0;
        double qsRankSimilarity = Math.abs(Integer.parseInt(userInput.getQs()) - Integer.parseInt(major.getQs())) >= 0 ? 1: 0;

        // 加权得分综合
        score += weights.get("country") * countrySimilarity;
        score += weights.get("major") * majorSimilarity;
        score += weights.get("qsRank") * qsRankSimilarity;
        major.setScore(score);
        recommendations.add(major);
    }

    // 根据加权的得分进行推荐排序
    recommendations.sort((c1, c2) -> Double.compare(c2.getScore(), c1.getScore()));

    return recommendations;
}

在需要调用的地方进行调用

java">/**
 * 推荐留学专业信息列表
 *
 * @param sysStudyAbroad 留学专业信息
 * @return 留学专业信息
 */
@Override
public List<SysStudyAbroad> recommend(SysStudyAbroad sysStudyAbroad)
{
	// 查询数据库专业数据
    List<SysStudyAbroad> majors = sysStudyAbroadMapper.selectSysStudyAbroadListAll();
	
	//设置权重值,国家为0.3,专业为0.5,qs排名为0.2
    Map<String, Double> weights = new HashMap<>();
    weights.put("country", 0.3);
    weights.put("major", 0.5);
    weights.put("qsRank", 0.2);
	
    List<SysStudyAbroad> recommendations = weightedRecommendation(sysStudyAbroad, majors, weights);
    recommendations = recommendations.subList(0, Math.min(20, recommendations.size()));
    for (SysStudyAbroad major : recommendations) {
        System.out.println("国家: " + major.getCountry() + ", 专业: " + major.getMajorId() + ", QS排名: " + major.getQs() + ",权重: " + major.getScore());
    }
    return recommendations;
}

用户输入如下

在这里插入图片描述

推荐结果如下

在这里插入图片描述

4.总结

特征加权推荐算法适用于在用户条件的基础上推荐额外的内容,适用于有2个特征以上的数据结构。

如有问题,欢迎评论区批评指正!❤️


http://www.niftyadmin.cn/n/5435350.html

相关文章

【C++map和set容器:AVL树、红黑树详解并封装实现map和set】

[本节目标] map和set底层结构 AVL树 红黑树 红黑树模拟实现STL中的map和set 1.底层结构 前面对map/multimap/set/multiset进行了简单的介绍&#xff0c;在其文档介绍中发现&#xff0c;这几个容器有个 共同点是&#xff1a;其底层都是按照二叉搜索树来实现的&#xff0c;但…

【STM32 定时器(二)TIM 输入捕获PWM 总结】

STM32定时器之输入捕获总结 OC介绍PWM介绍PWM初始化代码部分开启时钟配置时基单元配置CCR配置GPIO配置复用和重定义功能 开启定时器代码实现 &#xff1a;实现呼吸灯 OC介绍 PWM介绍 PWM参数计算 分辨率越细&#xff0c;分的分量越精细&#xff0c;越稳定&#xff0c;假如它为…

C/C++蓝桥杯之报数游戏

题目描述&#xff1a; n 个人站成一行玩报数游戏。所有人从左到右编号为 1 ~ n。游戏开始时&#xff0c;最左边的人报 1&#xff0c;他右边的人报2&#xff0c;编号为 3 的人报 3&#xff0c;以此类推。当编号为 n 的人&#xff08;即最右边的人&#xff09;报完 n 之后&#…

【linux】awk 命令

awk 命令 AWK 是一种处理文本文件的语言&#xff0c;是一个强大的文本分析工具。之所以叫 AWK 是因为其取了三位创始人 Alfred Aho&#xff0c;Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。 语法 awk [选项参数] script varvalue file(s) 或 awk [选项参…

vos3000有效避免盗打的一些方法

要避免VOS被盗打&#xff0c;你可以采取以下措施&#xff1a; 使用复杂的密码&#xff1a;系统密码应不易被猜测或容易破解&#xff0c;密码长度在8-10位以上&#xff0c;包含数字、字母及特殊符号4。 限制IP访问&#xff1a;限制访问系统的IP地址&#xff0c;只允许特定的IP访…

IntelliJ IDEA 2023.3.4创建JavaWeb应用和集成Tomcat服务器

1. 创建项目 如下图所示&#xff0c;只需要给项目起一个项目名称&#xff0c;然后点击Create即可&#xff1a; 2. Project Structure 设置 创建完成后如下图 3. 集成Tomcat服务器 4. 实现Servlet接口 当我们实现Servlet接口时&#xff0c;发现没有Servlet相关的依赖时&am…

ChatGPT国内镜像站大全

#今天在知乎看到一个问题&#xff1a;“平民不参与内测的话没有账号还有机会使用ChatGPT吗&#xff1f;” 从去年GPT大火到现在&#xff0c;关于GPT的消息铺天盖地&#xff0c;真要有心想要去用&#xff0c;途径很多&#xff0c;别的不说&#xff0c;国内GPT的镜像站到处都是&…

51单片机与ARM单片机的区别

51的MCU与ARM的MCU的区别 51单片机与ARM单片机区别主要体现在以下几个方面&#xff1a; 指令集架构&#xff08;ISA&#xff09;&#xff1a; 51单片机&#xff1a;基于Intel 8051架构&#xff0c;采用的是CISC&#xff08;复杂指令集计算机&#xff09;设计&#xff0c;其指令…