平安科技算法面经秘籍
《AI未来星球》陪伴成长的人工智能社群,价值过万的各种内部资源及活动,限时特惠中,点击查看。
求职跳槽福利:为了便于大家求职、跳槽的准备,大白将45家大厂的面经,按照知识框架,整理成700多页的《人工智能算法岗江湖武林秘籍》,限时开放下载,点击查看下载。
面经整理历程:经过一年多的努力,大白整理了超过3500篇,各类大厂的算法面经资料。
并将涉及到的知识点,按照知识框架,分类汇总,每个公司整理成一篇,比如本文的平安科技面经。
大家对照面经,可以了解心仪的公司,会根据你的简历,问哪些知识点?便于大家对掌握的知识,进行回顾梳理。
希望为大家在求职或者跳槽的道路上,提供一些帮助,为大家取得心仪的offer助力。
面经整理心得:大白也将整理所有面经的心得,写成了一篇文章,点击查看心得。
其他大厂面经:国内其他大厂的面经汇总,点击查看目录。
平安科技面经整理:江大白
1 平安科技面经汇总资料
1.1 面经汇总参考资料
① 参考资料:
(1)牛客网:平安科技面经-22篇,网页链接
(2)知乎面经:点击进入查看
(3)面试圈:点击进入查看
② 面经框架及参考答案:
(1)面经知识框架:点击进入查看
(2)面经参考答案:点击进入查看
1.2 面经涉及招聘岗位
(1)实习岗位类
【深度学习算法实习生】
(2)全职岗位类
【平安科技医疗组算法工程师】、【平安科技智能引擎部算法工程师】、【智慧农业算法工程师】、【平安产险算法工程师】、【平安人寿AI研发团队算法工程师】、【平安图像算法工程师】
1.3 面试流程时间安排
PS:以上流程为大白总结归纳所得,以供参考。
1.4 平安科技面试心得汇总
★ 不一定每一轮都有算法逻辑题
★ 感觉还是要多关注基础,面试时在编程能力和数学理论上起码要有一项说得过去。
★ 感觉会问基础的知识点,但主要是这些,不会进行很多的发散,延伸,所以最好所有知识点抖知道
★ 整体感觉:问得问题中规中矩、一般是人工智能的基础+项目深挖+少数算法题目
2 平安科技面经涉及基础知识点
2.1 图像处理基础
无
2.2 深度学习:CNN卷积神经网络方面
2.2.1 讲解相关原理
2.2.1.1 卷积方面
● 为什么要用1*1卷积?讲一下作用?
● Inception V3的1*1卷积和ResNet50的1*1卷积有什么不同?
● 1x1卷积在Resnet中的几种作用?
● Dropout原理
2.2.1.2 池化方面
● Pooling的作用?
● 池化层如何反向传播?
● 上采样有哪些方式?
2.2.1.3 网络结构方面
● 介绍一下Inception V3 和ResNet50?
● Inception V3基于之前的Inception系列最大的改进是啥?
● ResNet的特点有哪些?(答跳跃连接和瓶颈层)
● Resnet为啥能解决梯度消失,怎么做的,能推导吗?
● VGG网络讲讲怎么做的?
● 讲一下AlexNet和VGG的区别?
2.2.1.4 其他方面
● 梯度爆炸,梯度消失,梯度弥散是什么,为什么会出现这种情况以及处理办法?
● 图像的相似性测度有哪些?
2.2.2 数学计算
● 卷积核的参数计算
2.2.3 激活函数类
● Softmax的原理了解吗?
2.3 深度学习:RNN递归神经网络方面
2.3.1 讲解相关原理
● RNN,LSTM推导
2.4 深度学习:CNN&RNN通用的问题
2.4.1 基础知识点
● 讲一下attention机制,有哪几种attention机制?
2.5 传统机器学习方面
2.5.1 讲解相关原理
2.5.1.1 数据准备
无
2.5.1.2 特征工程
① 特征降维
● 降维方法,PCA降维的具体步骤?
② 特征选择
无
2.5.1.3 有监督学习-分类和回归方面
① 分类回归树(集成学习)
● 讲一下集成方法,Bagging,Boosting,Stacking?
A.基于bagging:随机森林
● 讲一下随机森林(RF)的原理(集成学习里面的Bagging)、随机森林怎么调参?
● 树的深度一般是多少?怎么来决定树的深度。
B.基于boosting:Adaboost、GDBT、XGBoost
● GBDT,XGBOOST的原理讲一下?
② 逻辑回归LR
● LR推导?
● 介绍一下LR及其损失函数 ?
③ SVM
● SVM所有核函数的了解应用,损失函数?
● SVM为什么用hinge loss,解释hinge loss,讲一讲SVM的损失函数?为什么要用Hinge Loss?
● SVM如何解决非线性分类?知道哪些核函数,说一下?
● SVM核函数性质
④ 朴素贝叶斯(Naive Bayes)
● 朴素贝叶斯基本原理和预测过程?
2.5.1.4 无监督学习-聚类方面
● 讲一下K-means的原理?
2.5.2 手推算法及代码
● 写公式并说一下KNN、 kmeans?
● 写一下LR和SVM的损失函数
● SVM推导
2.6 深度学习&机器学习面经通用知识点
2.6.1 损失函数方面
● 交叉熵的公式写一下?
● 损失函数为什么用binary_cross_entropy不用MSE?
● 知道哪些机器学习常用的损失函数?结合具体的机器学习算法来讲。(回答了分类:交叉熵损失,合页损失函数,回归:L1和L2损失,还说了一个Focal Loss)
2.6.2 网络优化梯度下降方面
● 讲一下梯度下降,原理?
2.6.3 正则化方面
● 正则化和未正则化有什么区别?未正则化对w和b的影响?
● L1,L2正则化的原理?
2.6.4 压缩&剪枝&量化&加速
● 了解过模型压缩方面的知识吗?
2.6.5 过拟合&欠拟合方面
● 过拟合欠拟合为啥? 怎么解决过拟合。
2.6.6 其他方面
● 类别不平衡怎么解决的?(从数据层面和算法层面来回答)
3 平安科技面经涉及项目知识点
3.1 深度学习:CNN卷积神经网络方面
3.1.1 目标检测方面
3.1.1.1 讲解原理
● 介绍一下瓶颈层?为什么要用瓶颈层?
3.1.1.2 损失函数
● 用过Focal Loss吗?讲一下 原理。
● L1和L2损失在目标检测中的应用知道吗?
3.1.1.3 手写代码
● 写非极大值抑制NMS,用python或者c++都行。
3.1.2 图像分割
● 知道U-Net吗?
3.1.3 图像分类
● 在分类任务中会用到哪些loss function?
● 为什么分类用交叉熵而不用MSE?
答:用 MSE 计算 loss 的问题在于,通过 Softmax 输出的曲线是波动的,有很多局部的极值点,即非凸优化问题 (non-convex) 。
而 cross entropy 计算 loss,则依旧是一个凸优化问题,用梯度下降求解时,凸优化问题有很好的收敛特性。
● 如果分类的数据图像每一类只有几张,你会用什么方法?(少样本训练,用知识迁移/词袋模型/数据增强)
3.2 深度学习:RNN递归神经网络方面
3.2.1 自然语言处理NLP
① Bert
● bert, bert的各种变形,bert结合知识图谱,bert结合多模态, bert压缩,bert优缺点?
● 为什么项目中采用了albert,不是用bert,albert怎么实现降低参数量,除了Albert还了解其他根据bert改进的模型吗
● bert的效果为什么那么好?(mask机制)
● transformer跟bert在position embedding上有什么区别?
② Word2vec
● Word2vec实施过程,遇到的困难之类的?
● word2vec和glove的原理讲一下?
③ 其他
● 了解textCNN吗,为什么可以在NLP领域取得成功?
3.3 强化学习
无
3.4 机器学习方面
3.4.1 推荐系统
● CRF和HMM的原理讲一下?
● CRF跟HMM的区别,CRF的损失函数是什么?
4 数据结构与算法分析相关知识点
4.1 数据结构与算法分析
4.1.1 线性表
4.1.1.1 数组
● 给定一个数组,找出数量大于数组长度的1/2的数字,不能用哈希表
● 无序数组怎么在最短时间内求出和为目标值的两个数?
4.1.2 排序
● 快排、快速排序的思想时间复杂度?
4.2 算法思想实战及智力题
4.2.1 算法思想实战
● 字典里面的key是长度为2~5的字符串,另外一个字符串从中间去掉连续的字符,最多去掉6个,剩下的字符串连接在字典中和key匹配,得到匹配的字符串的value?
● 求连续子数组最大和,
输入:[1,4,-5,9,8,3,-6]
输出:9,8,3
● 众数,不能用哈希表和排序
● 最长连续子序列
4.2.2 智力题
● 你有三个朋友在深圳,你想知道深圳的天气,你给每个朋友都打了电话。
● 三个人都说现在正在下雨,三个人说谎的概率都是1/3,问深圳下雨的概率是多大?
4.3 其他方面
4.3.1 矩阵运算
● 给一个矩阵,问从左上角到右下角有多少种走法?
4.3.2 其他
● 简历里有写到数学基础,所以面试官让我说一下怎么自己实现两个矩阵相乘的程序;然后问了我对于刚获得的数据,如何判断其分布,这时候我用了正态分布举例,所以面试官接着问,为何实际生活中大部分数据服从正态分布或者拟正态分布;在知道数据的分布之后,如何进行后续处理?
4.4 Leetcode&剑指offer原题
● Leetcode:螺旋矩阵
5 编程高频问题:Python&C/C++方面
5.1 python方面
5.1.1 基础知识
● Python用过哪些库或者框架?
● 序列去重怎么做?
● 讲一下apply函数的作用?
5.1.2 手写代码相关
● numpy问题:怎么取出一个矩阵中某一行的最大值(说出具体的函数)
5.2 C/C++方面
5.2.1 基础知识
● 简历上写了C,问了智能指针、Class和struct的区别?
6 操作系统高频问题:数据库&线程&常用命令等
6.1 数据库方面
无
6.2 操作系统方面
6.2.1 TCP协议相关
● 三次握手的原理
6.2.2 线程和进程相关
● 多线程的原理讲一下?
7 技术&产品&开放性问题
7.1 技术方面
● 知道奥卡姆剃刀准则吗?说说看。
● 场景题:假设有10000个样本,只有1000个样本有详细的框框出了目标的位置,另外9000张没有框,只是有类别标签而已,问怎么训练这个网络?
本文由 大白智能 作者:凯哲 发表,其版权均为 大白智能 所有,文章内容系作者个人观点,不代表 大白智能 对观点赞同或支持。如需转载,请注明文章来源。