成都信息工程大学...吧 关注:4,080贴子:14,492
  • 7回复贴,共1

写给想从事计算机视觉的吧友

只看楼主收藏回复

写在最前面
作为一名计算机视觉行业的从业者,从学校到公司,已经有8年左右时间,从基础的图像算法,到深度学习,再到现在主要从事的行业--3D传感领域。对整个行业有了深入的认识,希望通过这个帖子能够帮助到各位,笔者曾经在3D领域的独角兽公司工作,并获得企业认可,目前在上市公司就职,作为算法团队Leader,希望以邻家大哥的身份来分享一些学习经验以及专业知识,若有幸能帮助到各位吧友,那将是莫大的荣幸。
笔者擅长的领域:
a)机器人、汽车、手机视觉传感器行业;
b)3D光学测量行业:结构光、双目、iToF、dToF、线激光(均有量产经验);
c)消费级相机组成、生产流程、生产流程中各个部分设备所需算法(量产经验);
d)激光类--Diffuser、DoE生产过程中设备算法、终检算法(量产经验);
e)异构高性能计算编程:DSP、GPU(OpenCL、CUDA)(落地经验);
f)SLAM、DeepLearning了解行业发展现状;
g)其他未述待补充。
面向的吧友
笔者希望你是一名超过大二的,最佳是硕士研究生,因为接下来的内容总是需要一定的数学基础以及编程基础。如果你是一名完全没有基础的同学,那么对你来讲可能会比较吃力。其次,笔者希望你对图像、机器视觉、3D光学测量有浓厚的兴趣。如果你是一名刚踏入社会的毕业生,则期望你是计算机视觉行业的从业者,或者有着强烈意愿转入该行业,同时能够有一定的时间和能力去弥补专业上的偏差。
关于就业
行业内大部分算法企业笔者或多或少都有了解,我们可以在这边尽情讨论


IP属地:四川1楼2024-06-25 19:05回复
    从事计算机视觉的一些准备工作:
    1. 您需要知道什么是数字图像,什么是颜色,为什么图像如此绚丽多彩、变化万千;这里需要你学习一本教材-《数字图像处理》,这本书如果你在低年级看,可能会涉及到很多数学知识不理解,可以直接跳过,后期有了更高阶的数学知识,可以再回过头来学习,前期通过这本书搭建起来一个简单的框架;
    2. 当你有了一定理论基础的时候,需要你真正的通过计算机语言来实现书籍中的算法,如果你有志成为一名牛逼的算法工程师,笔者建议学习C、C++,如果你只是搞学术,那么建议你使用Python,或者最后的倔强是MATLAB,MATLAB主要用于快速验证和可视化;
    3. 大学期间一些重要的课程:高等数学非常重要,后面所有的数学知识可能都与它相关。线性代数与矩阵分析,对于数字图像来讲,你所处理的所有数据基本都是矩阵数据,你可以想象它的重要性了。概率与统计,大部分的AI基础来自于这里。最后,数值分析、最优化理论都是计算机视觉领域非常重要的课程。然后,多视几何也是帮助你理解空间的重要手段。最后,英语:任何时候都是你最重要的工具之一。
    有了以上准备工作之后,确定好自己感兴趣的细分领域便成了最重要的一个环节了。计算机视觉领域的细分行业有非常多。简单举例:医学图像处理(大多学校教研室的研究方向,实际就业面非常窄)、AI-在前几年AI迅速崛起的时候,可谓也是炙手可热,岗位需求巨大,随着市场逐渐饱和以及工具逐渐成熟化,逐步变成了一种做视觉的人必须要掌握的一项技能,但是不适合作为主业去发展、SLAM-这个方向倒是目前非常有前景的方向之一,但是需要你有非常扎实的数学、编程、paper功底,但是收益也是高的,动辄年薪百万不是梦、工业视觉AOI-这类算法工程师常年与机器、设备打交道,现在也逐步被AI渗透、最后就是笔者从事的3D sensing行业了-这也是一个小众行业,就业近两年逐步多起来了,随着汽车、机器人市场的应用。
    一定要在恰当的时候确定好自己的方向,否则会陷入盲目的困局。


    IP属地:四川来自iPhone客户端2楼2024-06-26 19:14
    回复
      ## 与数字图像相关的行业大致分类和笔者的看法(仅供参考)
      ### 【AI类】
      这类算法核心以机器学习、深度学习、XXX学习为明显特征。主要但不限于用于检测、分类、识别、分割等领域。也是目前在校学生研究最多的一个领域之一。最近火热的大模型(GPT)这类自然语言处理,暂且也归类到这里,实际不太准确。
      笔者的一些看法:
      计算机视觉的核心工具之一,在2015年开始大规模市场应用。随着工具和开源框架的成熟作为普通大学的研究生,甚至博士,想在这里面掌握核心技术,已经变得异常困难。但是AI类的岗位需求相对还是比较多的。但是薪资没有以往那么好了。
      建议:愿天下心诚剑士人人会两袖青蛇,天下心诚算法人人会深度学习。
      ### 【医疗图像类】
      医疗图像算是学术界传统算法应用较广的一个方向。也是老一辈做图像的导师研究比较多的领域。主要研究病理图像、医疗设备成像及优化、包括融合与配准之类的技术,近年AI在医学图像领域的应用也比较广泛。
      笔者的一些看法:
      相对而言入门门槛比较高,医疗数据不易获取。对口企业基本以医疗设备企业和一些大企业的医疗部门。坦白讲,就业面不是太广泛。不过好在灵活性还可以,只要你基础图像算法理论扎实。
      ### 【卫星、遥感图像类】
      坦白讲,小众到笔者基本没有接触过
      笔者的一些看法:

      ### 【空间重建类(SLAM、SFM等)】
      这个分类就厉害了,目前为止笔者认为对人才的要求是最高的一个行业。第一,需要扎实的数学功底;第二,需要良好的3D知识基础;第三,对编程能力要求也不低。但是收益与要求往往是成正比的。目前应用领域:机器人行业,汽车行业等等;
      笔者的一些看法:
      这个领域如果要成为大牛,建议一定要读985博士。如果一定要硕士毕业从事该行业,那么你的硕士阶段学校是很好的背书,当然也有普通学校技术真牛的大佬,同样也能混的风生水起。需要你付出长时间的努力,但是确实后期收益很高,并且这个行业未来也会是比较好的赛道。
      ### 【工业视觉和缺陷检测类】
      这个分类实际上需求还是蛮多的,主要是缺陷检测AOI,工厂生产流程中制造工艺缺陷的检出。其次就是分类、尺寸测量等等。
      笔者的看法:
      这个领域算是比较接近传统图像处理方向的。另外也逐步被AI渗透,需要就业者掌握AI这门工具。就业面比较广,但是薪资水平不高。
      ### 【3D感知类】
      这个行业下的细分领域也比较多,算是一个比较小众的领域,普通大学的研究生往往能通过这个领域来曲线救国,因为目前高校做这个行业的还不算很多。主要包含高精度的工业级3D感知:例如高精度结构光、消费级结构光、双目、Time-of-Flight等等,可能大部分在校学生都没有听过这个细分领域。
      笔者的看法(笔者本身所在的领域,见解难免会有主观因素,仅供参考):
      算是一个小而美的赛道,需要掌握的知识主要集中在图像更底层的部分,例如:相机本身的成像原理、多视几何、标定等等。但是这个赛道能帮很多普通大学的研究生在这个赛道不至于竞争激烈。薪资水平虽不算顶尖,但一定是靠前的。
      后续笔者将重点介绍这个行业,敬请期待


      IP属地:四川3楼2024-06-27 17:26
      回复
        什么是3D感知
        介绍这个之前,先讲两个基本的概念
        图像是什么:物理对象或者空间的二维投影的数字表示;
        点云是什么:物理对象或者空间的三维数字表示;
        3D感知的主要目的就是获取到点云数据。
        3D感知的技术分类-时域时域3D感知技术主要分为两大类indrect Time-of-Flight和drect Time-of-Flight,前者通过计算发射的调制激光的相位与接收回来调制激光的相位之间的相位差值间接的计算出激光飞行的时间。通过时间*光速得到被测物体的距离;后者则直接发送一个激光脉冲,接收端接收激光脉冲,计算发射与接收的时间差,因此称为直接法。
        3D感知的技术分类-空域
        双目技术(Stereo)双目3D感知的原理和人的双眼立体是一致的。通过两颗相机,观察同一个被测物体,通过该物体在两颗相机中成像的差异来判断被测物体的距离。只是我们把这个“差异”用一个更专业的名词来描述--视差
        单目结构光技术(StructureLight-SL)单目结构光的系统构成主要由一颗相机和一颗投影仪构成,投影仪负责投射出特定图形,将该图形投射到被测物体表面。与此同时,相机拍摄回具有投射图形的被测物体。通过分析被测物体表面的图形变化,来判断物体的三维信息。
        单目结构光技术的本质其实与双目是一样的--各位读者可以深入思考这句话
        线激光扫描技术(Laser Scan)激光线扫技术的系统构成由一个发射一字线的激光头和一颗相机构成,线激光投射到被测物体,相机拍摄回带线激光的被测物体,通过提取线激光与事先标定的激光平面,以此来获取点云数据。以上技术我会分类深入讲解技术原理。


        IP属地:四川来自iPhone客户端4楼2024-06-28 09:24
        回复


          IP属地:江西来自Android客户端5楼2024-06-28 10:24
          收起回复
            最近忙着做点云分析,没时间更新。
            其实搞忘了点云处理也可以是一个单独的细分领域。
            点云配准
            点云滤波
            点云mesh
            点云重建
            分割等等
            其实也算是一个比较小众且高薪的领域,有兴趣可以研究下


            IP属地:四川来自iPhone客户端6楼2024-07-02 22:32
            回复
              更新一下笔者心路历程,以此鼓励大家
              笔者本科就读于川内某二本学校,电子信息工程,本科期间英语挂科一次
              但是大学刚开始励志考研(只是内心想法,并对外吹牛),实际没有采取任何对考研有帮助的准备。
              大三备考,每天依旧佛系,目标院校,西安电子科技大学。每日自然醒,上午顶多看书1小时,下午三小时,其余时间---嗨皮。
              同宿舍同班级都认为我在开玩笑的考研,成绩平平,还不努力,天天游戏


              IP属地:四川来自iPhone客户端7楼2024-07-07 22:25
              回复