蘑菇街算法面经秘籍

《AI未来星球》陪伴成长的人工智能社群,价值过万的各种内部资源及活动,限时特惠中,点击查看。

求职跳槽福利:为了便于大家求职、跳槽的准备,大白将45家大厂的面经,按照知识框架,整理成700多页的《人工智能算法岗江湖武林秘籍》,限时开放下载,点击查看下载。


面经整理历程:经过一年多的努力,大白整理了超过3500篇,各类大厂的算法面经资料。

并将涉及到的知识点,按照知识框架,分类汇总,每个公司整理成一篇,比如本文的蘑菇街面经

大家对照面经,可以了解心仪的公司,会根据你的简历,问哪些知识点?便于大家对掌握的知识,进行回顾梳理。

希望为大家在求职或者跳槽的道路上,提供一些帮助,为大家取得心仪的offer助力。

面经整理心得:大白也将整理所有面经的心得,写成了一篇文章,点击查看心得

其他大厂面经:国内其他大厂的面经汇总,点击查看目录

蘑菇街面经整理:江大白

1 蘑菇街面经汇总资料

1.1 面经汇总参考资料

① 参考资料:

(1)牛客网:蘑菇街面经-13篇,网页链接

(2)知乎面经:点击进入查看

(3)面试圈:点击进入查看

面经框架及参考答案:

(1)面经知识框架:点击进入查看

(2)面经参考答案:点击进入查看

1.2 面经涉及招聘岗位

(1)实习岗位类

【图像算法实习生】

(2)全职岗位类

【应用算法工程师】、【图像算法工程师】、【推荐算法工程师】、

1.3 面试流程时间安排

PS以上流程为大白总结归纳所得,以供参考。

1.4 蘑菇街面试心得汇总

★ 面试官人很好,说什么都会给你回应。对项目会问很多细节。

★ 聊项目,问了类别不均衡问题,也问了模型可解释问题,好像蘑菇街喜欢可解释强的模型?然后当时引申的一个问题是,如果nn可以解决高维度离散问题,为啥还需要gcn来解决关联性的问题。其它不记得了。

2 蘑菇街面经涉及基础知识点

2.1 图像处理基础

2.2 深度学习:CNN卷积神经网络方面

2.2.1 讲解相关原理

2.2.1.1 网络结构方面

● 图像分类基础网络有何不同改进?

2.2.1.2 其他方面

● BN层的均值如何训练的?

2.3 深度学习:RNN递归神经网络方面

2.3.1 讲解相关原理

● LSTM和RNN有什么不同?

● LSTM如何解决RNN中梯度消失的问题?

● 项目中分别使用了LSTM和CNN进行文本分类,效果比较,为什么项目中LSTM的分类效果好?问了RNN、LSTM和CNN使用场景?

● 什么是梯度消失?LSTM为什么能解决RNN梯度消失问题?

2.3.2 手绘网络原理

● 手写LSTM门控公式?

2.4 深度学习:CNN&RNN通用的问题

2.4.1 基础知识点

● 方差和偏差是怎么回事?

2.4.2 模型评价

● 知道AUC吗,不均衡会对AUC产生影响吗,为什么?

2.5 传统机器学习方面

2.5.1 讲解相关原理

2.5.1.1 数据准备

2.5.1.2 特征工程

① 特征降维

② 特征选择

● 做过哪些特征工程,产生哪些类型特征(统计特征,交叉特征,转化特征都有什么),异常值怎么处理,数据平滑问题?

2.5.1.3 有监督学习-分类和回归方面

① 分类回归树(集成学习)

● GBDT调过哪些参数?

● 正负样本比对lr,gbdt影响,为什么,用lr比例N/P比为1会怎么样?

② 逻辑回归LR

● LR和GBDT有什么区别,为什么GBDT结果比LR好?

● 正负样本比对LR,gbdt影响,为什么,用LR比例N/P比为1会怎么样?

● LR原理、损失函数?

● LR的详细过程怎么处理?

● 你说LR模型可解释性高,它的可解释性体现在哪里?是权重越大,可解释性就越强吗?

③ SVM

● SVM原理、损失函数?

④ 朴素贝叶斯(Naive Bayes)

● 贝叶斯公式的原理?

⑤ 决策树(DT)

● 你说一下信息增益的原理?

2.5.1.4 无监督学习-聚类方面

● 详细说一下K-means聚类,你每个簇怎么选样本的,距离用什么算的?

2.5.2 手推算法及代码

2.6 深度学习&机器学习面经通用知识点

2.6.1 损失函数方面

● 知道哪些损失函数?

2.6.2 网络优化梯度下降方面

● 知道熟悉什么优化算法,SGD和Adam的公式是什么样的,怎么迭代计算的?

● Adam的思想?Adam能否适用于稀疏数据?

● SGD,Adam等,以及他们的参数更新公式?

● 梯度下降如何跳出局部最优值?

● 如何解决陷入局部最小,自适应学习率方法?

2.6.3 压缩&剪枝&量化&加速

● 模型简化压缩怎么处理的?

2.6.4 过拟合&欠拟合方面

● 过拟合的原因?如何解决过拟合?

2.6.5 其他方面

● 机器学习和神经网络的选择问题?(什么情况下使用神经网络会取得较好的效果)

3 蘑菇街面经涉及项目知识点

3.1 深度学习:CNN卷积神经网络方面

3.1.1 目标检测方面

3.1.1.1 讲解原理

● Soft-NMS和NMS的不同点?

● FPN的原理?

● 项目细节,检测算法目前是怎么做的,跟踪问题经典的一些方法以及目前比较常用的方法 ,以及你的创新改进?

3.1.1.2 损失函数

● RetinaNet 的loss function是什么?

● 用到的Focal loss的公式,怎么用的,原理参数含义?

● Focal loss是怎么缓解样本不均衡问题的,还有其他的方法吗?

3.1.1.3 手写代码

● 手写NMS?

3.1.2 目标重识别

● ReID用的网络是什么样的,损失函数是怎么构建的,公式是什么样的?

3.2 深度学习:RNN递归神经网络方面

3.2.1 自然语言处理NLP

① HMM隐马尔科夫模型

● HMM 的维特比算法

② Word2vec

● 介绍Word2Vec,我就把把CBOW, skip-gram, hierarchical softmax, negative sampling,介绍了一遍?

③ CNN方面

● 介绍TextCNN?

3.3 强化学习

3.3.1 讲解原理

● 问Q方法,说一下强化学习中DQN算法?

● 强化学习的分类?

● 值函数方法有哪些?

● 随机策略相对非随机策略优缺点?

● 熟悉的策略梯度方法?

● 如何改进ppo算法?

● 对V函数和Q函数的看法,为什么要有V和Q?

3.4 机器学习方面

4 数据结构与算法分析相关知识点

4.1 数据结构与算法分析

4.1.1 线性表

4.1.1.1 数组

● 最大连续子数组和?

● 两个排序数组合并成一个数组?

● 给一个数组和一个数,求数组中有多少对和为该数的数?

4.1.1.2 链表

● 实现链表反转?

● 两个单链表并集?

4.1.1.3 字符串

● 大数相加,转换成字符串,对每个字符相加减,考虑进位?

● 字符串排列

4.2 算法思想实战及智力题

4.2.1 算法思想实战

● 分糖果问题?

● 10个大文件返回词频top10的词?

● 统计top100词频?

4.3 其他方面

4.3.1 矩阵运算

● 写一下矩阵相乘代码,我有三列是数据,itemid category ctr,我想取每一类的item里面ctrctr最高的100个,写一下代码?

4.4 Leetcode&剑指offer原题

● Leetcode 135:分糖果问题

5 编程高频问题:Python&C/C++方面

5.1 python方面

5.1.1 基础知识

● Python的装饰器解释一下?

5.2 C/C++方面

● C++动态绑定,数据结构了解不?

6 操作系统高频问题:数据库&线程&常用命令等

6.1 数据库方面

6.2 操作系统方面

7 技术&产品&开放性问题

7.1 产品方面

● 场景题:比如用户点击了广告跳转进来,要展示一屏幕的物品给他,该怎么做?可以说一下整个流程吗?

● 一个商家。第一天看A商品和B商品的点击率。点击率公式是点击/曝光。然后,平均的是a的点击加b的点击/a的曝光加b的曝光。问,第二天发现,a的点击率和b的点击率上升了,但是平均的下降了。是什么原因,从哪些方面入手去解决这个问题?

本文由 大白智能 作者:凯哲 发表,其版权均为 大白智能 所有,文章内容系作者个人观点,不代表 大白智能 对观点赞同或支持。如需转载,请注明文章来源。

发表评论

This site is protected by wp-copyrightpro.com