舒:从工程化的角度,聊聊AI落地的那些事
自从大白在知乎、CSDN等平台,不断分享文章、视频后,很多朋友添加大白的微信(wxqzy68)。
在相互交流中,很多小伙伴从他们的角度,分享了很多AI行业的经验,很多人也都加入了《AI未来星球》。
从本周开始,大白将这些宝贵的工作、人生经验,也分享给大家,希望对大家工作学习有帮助。
PS:《AI未来星球》加入方式,可点击查看。
分享人:江大白
社群编号:V011号
所属方向:系统开发
所在行业:智能安防
01
个人简介
大家好,我是舒,目前坐标北京,硕士毕业5年多,传统互联网大厂出身。
毕业后一直在从事后台开发,主要与传统互联网“三高”打交道:高并发、高性能、高可用。
和大多数人一样,是个实实在在的码农。
业余时间也注册过公司,尝试过创业,不过成绩不咋地,其中原因归结于技术人员“想当然”的理想主义,和市场脱轨。
02
为什么进入AI行业?
大概三年前,进入了人工智能这个风口行业,原因很简单,想当风口上的猪。
现在的人工智能无疑和21世纪初的互联网行业一样,迷幻而充满机遇。
所以毅然从传统互联网,跳入了自己不熟悉的人工智能行业。
现在公司主要的方向是智能安防,这也算是人工智能行业,尤其是图像算法,落地产品最多的领域吧。
平时工作主要分2个方向,用大白话说就是:
l 第一:低代码的算法任务联动平台
那么这是啥?
其实是一个针对某个具体应用场景,提供完整解决方案的的低代码平台。
举个例子:
某个安全生产基地内,对行人进行识别。
当检测到人后,触发工作服、安全帽的检测,并对未合规的人员进行跨相机的跟踪。
这里面从算法角度任务可分为三类:行人检测、工服识别、单目标跨相机跟踪。
每个任务其实都是很明确的,我们的算法搭积木平台,就是通过简单拖拽、上下游联动等概念,将这些算法任务串起来;
而不是来一个项目,就写一套代码。
对于我这样的工程化人员,在这个方向上可以说是比较得心应手的。
它不涉及具体的算法,更多的体现的是各模块的联动、算法的集成、平台的高可用。
这是传统的程序员,或者是非算法人员擅长的领域。
那么为什么做这个平台呢?
从AI产品落地而言,最核心的环节一直都不是算法。
各公司之间的壁垒也不是以算法为主,大家说白了都是开源的模型,进行具体场景下的微调。
与其在算法模型的小数点后打得火热,不如将自家平台的灵活性多提高些。
具体场景下的解决方案更完善些、更灵活些。
这也是工程化人员,着重面对的一个问题。
最近几年,各方对人工智能的要求也愈来愈高。
简单检测个人脸、识别个车牌,肯为这些零散功能买单的客户已经很少了。
客户希望的是打通上下游,做更针对行业的产品。
这也是为啥AI四小龙这么多年来在实际产品落地种,屡屡吃瘪的一个原因。
l 第二:模型微调平台
这边主要指模型训练微调。
因为在项目中,往往需要根据不同的项目数据、针对具体场景,进行模型检测效果的提升。
这里面会要求从业人员,有基础的神经网络知识储备,角色接近“调参侠”。
这类工作做多了,很多微调环节可以固化下来,形成一套Pipeline。
另外,经过这么多模型的迭代后,让人深刻理解到,相比于大神创造的模型。
数据集和特征工程,真心是对产品落地,更重要的因素。
因此公司开发了一套基于Flink流式处理引擎,集特征工程、在线/离线学习、在线预测为一体的SaaS平台,部署在云端。
总体来说,允许现场技术人员,按照固定数据格式、类别、项目场景进行数据整理后,简单导入微调平台,即可在线微调。
大大缩短了模型迭代的周期,形成了一套模型-微调数据集的闭环链路。
03
AI行业如何打怪升级?
和算法出身的科班学生不同,我觉得我在如何入门AI上,有更普适的观点,适合像我一样转行过来的人。
第一点:术业有专攻
对于跨行的人员,强烈不建议在算法上过于钻牛角尖。
理由很简答,术业有专攻,明确自己的定位方向。
代码敲起来,多看多练,这是我们擅长的。和很多人一样,李沐的动手学深度学习系列,是我实操的蓝皮书。
第二:多看讲解视频
我自己也是从看吴恩达的机器学习、深度学习的视频过来的;
也看过大白的视频,觉得大白的视频对新手特别友好,并且还有项目实战说明,就算对算法不特别明了,也能听得懂。
第三:查漏补缺
为了夯实自己的基础,除了看视频,书也肯定需要看一些。
李航的统计学习方法,西瓜书之类的,也啃过一段时间。
总体感觉可以当做字典,平时遇到困惑的知识点,翻过去查。
04
AI行业印象深刻的事?
因为自己所在的单位,规模不算大。
平时项目中往往会遇到,AI大厂的算法解决不了的事。
但靠我们“工程”上的积累,却能解决的事,在这里和大家也分享下。
比如在某园区里,同样要检测人的着装这类问题的算法效果:往往受相机角度、距离等因素的制约。
当时甲方出于安全起见,不允许乙方乱装其他相机,只允许用现有的相机解决行人着装识别问题。
这时某AI大厂就犯难了,扬言在当前相机角度下,出不了好的识别效果。
但我们公司换了个路子,不直接拼算法,我们用在其他项目中积累的“枪球联动”,“指哪儿打哪儿”能力。
先使用枪机画面检测到人,再触发场内的球机,转到指定位置,变焦,捕获到更好的图像,输入给算法。
就这简单一招,就能大大提升,识别效率。
说这个事,是想说明一点,人工智能时代,是多传感器的时代,合理运用其他的传感器,换个角度,往往问题解决效果更好。
05
如果遇见之前的自己
建议就说一点:作为转行过来的工程化人员,基本的工程能力和洞察力不能丢。
像C++20标准发布都快一年了,新的协程有去尝试吗,性能怎么样?
作为工程化人员,泛型编程、函数式编程、或者教科书里23种设计模式,在实际代码中,能不能运用起来?这些都需要工程人员时刻提醒自己。
人工智能是给传统程序员多了一个维度的生长可能,但真正令我们发光的点,或者说是与传统算法人员不同的点。
一定是我们在多个能力维度的交界处,总而言之,对于工程人员,7分精力放工程上,3分精力放算法上,多考虑些交叉领域的事,是我的建议。
最后,欢迎大家加入AI未来星球,期待与大家在这里相遇!
本文由 大白智能 作者:yang 发表,其版权均为 大白智能 所有,文章内容系作者个人观点,不代表 大白智能 对观点赞同或支持。如需转载,请注明文章来源。