浅谈计算机视觉技术进展及其新兴应用

发表时间:2020/10/29   来源:《建筑科技信息》2020年第6期   作者:李纪敏 胡宗贤 董福明 代雪
[导读] 从市政安防、自动驾驶、影视娱乐、时尚设计,到日常生活中触手可及的人机交互、刷脸认证、扫码支付、相册管理,再到目前新兴的电商平台领域应用,等等,计算机视觉技术正持续快速地落地与渗透

        摘要:近年来,随着大数据的发展和深度学习的推进,人工智能逐渐进入大众视野,不管其是否可以如科幻故事中诉说的那般造福人类,它都正在逐步渗透进人们的生活。其中,计算机视觉是人工智能落地的最好的领域之一,由于人眼可以包罗万象,因此计算机视觉的应用也是无处不在。从市政安防、自动驾驶、影视娱乐、时尚设计,到日常生活中触手可及的人机交互、刷脸认证、扫码支付、相册管理,再到目前新兴的电商平台领域应用,等等,计算机视觉技术正持续快速地落地与渗透。
        关键词:计算机视觉技术;进展;新兴应用


        引言
        随着现代科学技术水平的不断发展,计算机硬件与软件部分都获得了较大的突破,由此促进了以计算机软硬件为载体的计算机视觉技术的进步,使得计算机视觉技术广泛地应用到多个行业领域中。手势识别技术就是其中非常典型的一项应用,该技术建立在计算机视觉技术基础上来实现人类与机器的信息交互,具有良好的应用前景和市场价值,吸引了越来越多的专家与学者加入到手势识别技术的研发中。手势识别技术是以计算机为载体,利用计算机外接检测部件(如传感器、摄像头等)对用户某些特定手势进行精准检测及识别,同时将获取的信息进行整合并将分析结果输出的检测技术。这样的人机交互方法与传统通过文字输入进行信息交互相比较具有非常多的优点,通过特定的手势就可以控制机器作出相应的反馈。
        1计算机视觉技术相关概念
        1.1相关概念
        计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,与计算机系统相连来分析、处理数据信息的一项视觉信息的技术,它是在现代社会科学技术发展下新兴起的一项高新技术。在技术运行上具体是通过用摄像机来代替人眼,计算机主体充当人的大脑,使其能够在技术的支撑下进行识别、判断以及记忆目标的功能,代替人类进行部分生产作业。现如今,该项技术已在众多领域得到推广使用。
        1.2工作原理
        在亮度满足要求的情况下,摄影机开始通过镜头对具体事物的图像信息进行采集,接着利用进行内部信息的输送,计算机系统迅速响应与接收,并利用图像处理技术进一步处理原始图像,优化图像效果,分类与整理图像中的关键信息,从而识别提取到所需的精准、高层次的抽象信息,最后再将信息储存到数据库中,以用来实时对需识别事物与所储存信息的进行对比,高效地完成技术运行作业。
        1.3理论框架
        自20世纪80年代起,计算机视觉技术在市场上所占比例开始直线攀升,从理论的归纳提出,到应用策略问题的解决,计算机视觉技术在不断的完善。视觉计算理论研究层次涵盖计算机理论、算法以及实际执行等多个方面。如若以计算机的理论视角入手来分析视觉技术,需要借助于要素图、维图以及三维模型表像来进一步探索。在此过程中,我们通过有效信息的传送进而去完成处理、识别等作业。视分析作业的复杂程度,大致可分为低层、中层、高层视觉处理三大层次,方便于用户根据需求自行选择,快捷地完成功能命令。
        2计算机视觉技术进展及其新兴应用
        2.1内容审核
        内容审核在互联网内容领域有较大的应用必要性,确保网络平台的运营遵守国家网络内容安全规范,避免监管风险,例如约谈、整改、罚款甚至关停等。可应用在互联网领域的电商、社交、新闻传媒等平台,从而对内容安全进行把控。这类审核产品有效地利用了计算机视觉的识别分类技术、目标检测技术等。例如智能鉴黄,应用图像的识别分类技术,对人体裸露的敏感部位、敏感涉黄动作的图片与视频进行识别,将海量图片或视频分为正常、低俗、涉黄等不同类别,从而依据其类别与置信度过滤涉黄违禁图。


算法审核极大地缩小人力审核的工作量,大幅节约了人力的审核成本,并减少了对审核人员造成的精神伤害。另外,利用算法对暴恐场景、违禁品进行识别,需应用识别分类技术并结合目标检测技术,将图库中的涉恐及违禁品图片进行分类,包括暴乱、血腥、爆炸火光、管制刀具、违禁枪支、毒品、赌博行为等。同时,可以对图中恐怖组织旗帜的标识进行目标检测与识别。利用算法对大规模数据进行过滤,可以有效地避免给用户带来的不适体验和错误引导,减少危险信息利用网络传播的风险。
        2.2应用医学自动化领域
        在医学自动化领域也可从CT图像、X射线图像上等多方面看到计算机视觉技术的应用。高新技术的辅助应用,在一定程度上简化了诊断流程,方便医生可准确判断病人病情。不仅在医疗诊断过程中计算机视觉技术可发挥出功效,而且在生产药品方面该项技术也可用于检测药品包装的合格程度。当向传送装置下达运输命令,传送装置通过内置的检测与分离两个区域,迅速采集的所需图像信息与传送药品到指定区域,接着将采集信息传递到计算机系统,进而去进行处理,精准地识别出未能包装好的药品,将信息传递到分离区,由分离区的自动装置进行药品的分离,有效地分类出包装好的药品与未能包装好的药品,这一检测过程大大地简化了传统检测的流程,在很大程度上减少了人力、物力的浪费,并做到了准确无误的检测,完善了药品生产的自动化作业,让工作效率得以提升,节约了企业经营成本,为企业创造更多收益。从此处可以看出,在医学自动化领域中应用计算机视觉技术既可以辅助医疗诊断,又可推动药品生产,值得被广泛推广使用。
        2.3运用DTW的动态手势识别方法
        动态时间归整(DynamicTimeWarping,DTW)方法,最开始是运用在智能语音识别领域,并获得了较好的应用效果,具有非常高的市场应用价值。动态时间归整方法的工作原理是以建立可以进行调整的非线性归一函数或者选用多种形式不同的弯曲时间轴来处理各个时间节点上产生的非线性变化。在使用动态时间归整方法进行目标信息区分时,通常是创建各种类型的时间轴,并利用各个时间轴的最大程度重叠来完成区分工作。为了保证动态时间归整方法能够在手势识别中取得较好的效果,研究人员已经开展的大量的研发工作,并实现了5种手势的成功识别,且准确率达到了89.1%左右。
        2.4运用模板匹配的方法
        众所周知,被检测的手势不会一直处于静止状态,也会存在非静止状态下的手势检测,相对来说动态手势检测难度较大,与静态手势检测的方式也有一定的区别,而模板匹配的方法通常运用在静止状态下的手势检测。这种办法需要将常用的手势收录到系统中,然后对目标手势进行检测,将检测信息进行处理后得到检测的结果,最后将检测结果与数据库中的手势进行比对,匹配到相似度最高的手势,从而识别出目标手势指令。常见的轮廓边缘匹配以及距离匹配等都是基于这个方法进行的。这些办法都是模板匹配的细分,具有处理速度快、操作方式简单的优点,然而在分类精确性上比较欠缺,在进行不同类型手势进行区分时往往受限于手势特征,并且能够识别出的手势数量也比较有限。
        结语
        计算机视觉技术在视觉理解和内容生成方面都有深度的拓展,其中发展较为成熟的技术已经落地应用到实际工业场景,并得到了有效海量数据的验证与认可。计算机视觉技术应用在诸多新兴领域,例如在电商领域,通过对大规模数据的批量处理,完成人力无法轻易完成的工作量,有效地对大数据质量进行把控。对计算机视觉技术自身而言,由于目前落地产品大多是数据驱动,研究的热点包括小样本学习、迁移学习及无监督信息学习等方面,致力实现通过提供少量的训练样本或是无完备标注信息的样本,得到效果理想的模型。
        参考文献
        [1]王依楠.船舶自动识别系统中的计算机视觉技术应用[J].舰船科学技术,2019,41(02):76-78.
        [2]黄藩,刘飞,王云,等.计算机视觉技术在茶叶领域中的应用现状及展望[J].茶叶科学,2019,39(01):81-87.
        [3]应婧,王攀,卢营蓬,等.计算机视觉技术在农业上的应用初探[J].四川农业与农机,2019(01):25.

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: