2023实习面经

实习面经

秋招笔试面试全记录

字节-电商

字节实习一面:

  1. 二分类的损失函数是什么,怎么算?
  2. 多分类的损失函数怎么算?
  3. 如果文本分类的标签有多个,比如一个文本同时属于多个label那怎么办?
  4. 如果文本分类里面的有的数据就是错的,label标注就是错的,应该怎么clean
  5. 简述一下lstm的结构
  6. lstm的每个cell之间怎么传的,是怎么算的
  7. Layer norm怎么做的?详细说一下,可以举例子
  8. Layer norm和Batch norm的区别
  9. multi-head多头的作用是什么?
  10. multi-head与单头相比,哪个参数会更多
  11. 加入一个全连接神经网络,权重参数初始化全部为1的话,会怎么样,最开始的输入层会有什么问题吗,隐层呢?
  12. BERT的输入输出
  13. 假如让你做一个开放式的文本分类任务,你应该从特征工程,模型构建,预测各个阶段具体怎么做?
  14. 介绍自己做的工作
    算法题,
  • 两数之和,返回列表中所有满足和为target的下标二元组,输入数据会有重复数字
  • 正则表达式,匹配【space】【char】*3之后的数字,并加一
  • 如’ abc1236 abcd124 abn12368‘ 返回[’ abc1237’,’ abn12369’]
def add(temp):
   #int()参数必须是字符串,类似字节的对象或数字,而不是“re.Match”
    strNum = temp.group()           
    num = int(strNum) + 1
    return str(num)
import re
input_str=" abc123 anv1234 abnd179"
ret=re.findall(' [A-z]{3}\d+',input_str)
res=[]
for s in ret:
    rest=re.sub('\d+', add, s, count=0)
    res.append(rest)
print(res)

百度-NLP

百度实习一面

  1. malloc和new的区别?
  2. lamda和map
  3. 合并两个python数组,有几种方法,从内存的角度说
  4. linux基本命令,把一整个目录的文件复制到其他目录下
  5. shell基本命令,如果一个文件,有很多行,选出出现abc的所有行
  6. transformer的优缺点?对比CNN和RNN

算法题:

  • 旋转数组中查找一个数字target(二分)
  • 二叉树后序遍历

百度实习二面

算法题:

  1. 最长公共子序列,返回序列
  2. 问答:发报器敲击发出0和1的概率不同,请问怎么封装使得可以出现0和1的概率相同?
    做完开始问
  3. transformer的优点缺点?
  4. 场景题:如果让你对40亿url中选择出现重复次数最高的10条,要怎么做?
  5. url数据太大,怎么解决内存问题。
  6. 介绍工作
  7. BERT的预训练任务,输入输出
  8. self-attention怎么算的,后面具体细节

百度实习三面

  1. 自我介绍
  2. 介绍项目
  3. 遇到过最难的问题,怎么解决的?
  4. 场景题:比如现在有微博的评论,问你怎么检测其中违规的不良言论。

http://www.niftyadmin.cn/n/83101.html

相关文章

树莓派4b系统安装

文章目录一.树莓派系统和工具下载二.树莓派系统烧录一.树莓派系统和工具下载 树莓派系统下载:https://www.raspberrypi.com/software/operating-systems/ 下载系统镜像写入工具:Win32DiskImager https://sourceforge.net/projects/win32diskimager/ …

leaflet 根据一组点的值生成凹包,并在地图上显示(081)

第081个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中根据提供的多个点,利用turf生成凹包。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式示例源代码(共88行)安装插件相关API参考:专栏目标示例效果 配置…

SSH 服务支持弱加密算法

漏洞扫描有SSH 服务支持弱加密算法,解决方案有两个: 方案一:修改 SSH 配置文件,添加加密算法: vi /etc/ssh/sshd_config 最后添加一下内容(去掉 arcfour、arcfour128、arcfour256 等弱加密算法)…

匈牙利算法学习笔记

匈牙利算法学习笔记1. 前言1.1 二分图1.2 二分图匹配2. 匈牙利算法(Hungarian Algorithm)2.1 基础概念2.2 实现步骤参考链接:1. 14-4:匈牙利算法 Hungarian Algorithm1. 前言 1.1 二分图 二分图通常针对无向图问题。假设G(V,E)G(V,E)G(V,E)是一个无向图…

Spring MVC 源码之MultipartResolver 组件

MultipartResolver 组件,内容类型( Content-Type )为 multipart/* 的请求的解析器,主要解析文件上传的请求。例如,MultipartResolver 会将 HttpServletRequest 封装成 MultipartHttpServletRequest 对象,便于获取参数信息以及上传…

【数组与链表算法】矩阵算法在程序中常见的简单应用 | C++

第二十三章 矩阵算法 目录 第二十三章 矩阵算法 ●前言 ●矩阵算法与深度学习 ●一、矩阵相加 ●二、矩阵相乘 ●三、矩阵转置 ●四、稀疏矩阵 ●总结 前言 数组与链表都是相当重要的结构化数据类型,也都是典型线性表的应用。线性表用于计算机中的数据存储结构…

如何在SpringBoot项目上让接口返回数据脱敏,一个注解即可

1 背景需求是某些接口返回的信息,涉及到敏感数据的必须进行脱敏操作2 思路①要做成可配置多策略的脱敏操作,要不然一个个接口进行脱敏操作,重复的工作量太多,很显然违背了“多写一行算我输”的程序员规范。思来想去,定…

QT(57)-QWT+VS2019+QT5.12.4环境配置-x86

1.下载QWT源码。 2.用VS2019-MSVC2019编译生成6个文件。 3.配置6个文件,把6个文件放对应的目录下。 4. 用自带的example检测配置环境。 1.下载QWT源码 Qwt Users Guide: Qwt - Qt Widgets for Technical Applications2.用VS2019-MSVC2019编译生成6个文件. #qw…