高中作文网

计算机视觉与应用(6篇)

时间: 2024-02-01 栏目:公文范文

计算机视觉与应用篇1

关键词:计算机辅助环境艺术设计起源现状及发展

随着计算机软硬件的进步,计算机辅助设计逐渐成为建筑效果图表现的主流。所谓计算机辅助环境艺术设计是指设计师通过计算机技术表现设计意图,最终以图像的方式告知客户,使客户清晰地理解设计师的设计意图和创意,它是一种更为直接、有效的表现方式,通常又被人们称为计算机建筑效果图。

一、计算机辅助环境艺术设计的起源

计算机的发展及应用,使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生,计算机辅助设计的研究构想发端于1950年,但使用计算机绘图的最早记录是在1963年,美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文,从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年,这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术,使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。

最初CAD被解释为“计算机辅助绘图”,由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具,但随着后来信息技术的飞速发展,计算机技术在各领域的广泛应用,CAD的含义也在不断变化扩展,随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等,使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形,从而使CAD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品,这也标志着新的视觉艺术形式的诞生得到了社会的承认。

我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似,国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初,随着我国现代化进程的迅速发展以及计算机的进一步普及,在环境艺术设计和创作领域,计算机技术应用的价值,逐渐得到人们的重视。

二、我国计算机辅助环境艺术设计的现状

计算机作为信息时代重要的技术工具,在环境艺术设计领域得到普遍应用。在20世纪90年代前,国内对环境艺术设计效果的表现是使用手工绘制的方法,到了20世纪90年代初期,计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末,计算机辅助设计逐渐成为建筑效果表现的主流。起初,设计师主要运用AutoCAD软件进行施工图的绘制,在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步,它自身的强大优势得以显示,同时对传统手绘表现产生了越来越大的冲击。

随着近十几年来我国计算机辅助环境艺术设计的发展,计算机建筑效果表现的类型己经有了很细致的划分,可以分为:计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSMAX,Lightscape,Photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图,透视点位置及视点角度均可变换,然后再渲染出二维图像,这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSMAX软件的三维动画功能,在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。

三、计算机辅助环境艺术设计的发展趋势

当前,随着计算机软硬件技术的迅猛发展,计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用,比如各种方案的汇报、投标以及招商广告中随处可见,从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术,想方设法掌握各种绘图软件,在模型、材质、灯光以及各种渲染技法上花费大量的时间,而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术,是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为,从审美主体的角度来看,艺术离不开创造者和欣赏者两个方面,而这两个方面都要通过一定的感官和相应的感性物质媒介,前者创造出审美对象,后者达到审美愉悦。所以说,作为视觉艺术的计算机辅助设计作品既要真实的描绘场景,又要使欣赏者达到审美偷悦。不可否认,人们的欣赏水平在不断提高,求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步,计算机技术的发展对于社会和艺术创造产生了重大的推动作用。

在计算机辅助环境艺术设计发展的初级阶段,设计师的目标是使效果图具有真实感,能够模拟未来场景的真实效果,具有一定的实用性。目前的计算机建筑效果图的风格单一,已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象,筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉,采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景,可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案,所以说虚拟现实技术不仅可以使用于建筑表现,而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景,将给环境艺术设计带来革命性的改变。

设计师创造出审美对象,要使欣赏者达到审美愉悦而不是审美疲劳。为此,根据目前我国计算机辅助环境艺术的发展情况,未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。

参考文献:

[1]邓庆尧.环境艺术设计[M].济南:山东美术出版社.

[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[M].北京:中国建筑工业出版社.

[3]张绮受.中央工艺美术学院一环境艺术设计与理论[M].北京:中国建筑工业出版社.

计算机视觉与应用篇2

一、计算机视觉检测技术含义

计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。

二、计算机视觉检测的基本原理

要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computervision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。

作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。

三、亚像素检测技术

随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。

边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。

四、计算机视觉检测技术在机加工零件检测中的应用要素与过程

(一)曲阵CCD相机

面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。

(二)工业定焦镜头

在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。

(三)数字图像采集卡

随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。

(四)标定板

为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。

(五)背光源

背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。

五、结语

随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。

【参考文献】

计算机视觉与应用篇3

关键词:计算机辅助平面设计;视觉美学

随着互联网技术的发展,计算机技术在社会各个领域中得到广泛应用,在平面设计领域,计算机也得到越来越广泛的应用,计算机辅助平面设计就是在进行平面作品的设计和测试过程中,利用计算机平台来进行设计与制作,在计算机辅助平面设计中,视觉美学的运用对最终的作品会产生很大的影响,在计算机辅助平面设计中,通过对计算机的巧妙运用可以极大地增强设计的视觉美学效果,为作品增光添彩。

1计算机辅助平面设计的视觉美学综述

平面设计作品可以通过简洁的图形语言把设计者的意图表现出来,而且它的艺术性非常强,传播效果比较好,艺术风格巧妙,由此我们可以看出,在多媒体与3D技术飞速发展的时代,平面设计仍然保持着强大的生命力不是偶然的。平面设计包含的类型多种多样,比如:绘画、摄影、平面广告、招贴画甚至书法等都可以利用计算机辅助来进行平面设计与创作。

在平面设计作品中,秩序美是非常重要的,一个好的平面设计作品必然会遵循一定的视觉表现秩序,比如对称、黄金分割等,这些视觉美学元素运用在计算机辅助平面设计作品中,能够让作品看上去更加和谐,更加符合人们的审美习惯,对一个平面设计作品好坏的评价在很大程度上取决于作品中各个元素之间的位置关系、比例关系以及元素本身的比例关系等的安排,只有在对这些元素进行安排时符合一定的视觉美学标准,才能够为作品增加更多的艺术效果。

目前,很多的图形设计平台都无法为设计者提供设计方面的理论支持与判断,需要用户在进行设计时,提高自身的艺术修养与设计规范,准确把握视觉美学设计要点,把视觉美学的知识准确的运用到设计作品之中,才能够创作出更好的设计作品。很多设计者在进行计算机辅助平面设计时,虽然精通设计软件的使用,但是缺乏视觉美学的相关知识,设计出来的作品混乱不堪,毫无艺术性可言。所以,平面设计工作者在掌握计算机软件基础的前提下,要努力提高自身的视觉美学修养,把计算机辅助平面设计与视觉美学有机结合到一起,创造出更加令人满意的平面设计作品。

2视觉美学中的几何美学

2.1视觉美学中的设计几何美学

自然界中的各种事物都有一定的比例关系,比如人与动物、植物的成长方式都遵循着1:1.618的黄金分割比例,这些自然比例被平面设计师发现并运用于平面设计作品中,为视觉美学的运用提供了最基本的出发点,这种视觉美学的基本原理可以运用在计算机辅助平面设计之中,能够让作品整体看起来更加的和谐、对称与平衡,使平面作品更加符合人们的视觉审美体验。

2.2视觉美学中的黄金分割比例

我们可以利用一条线段来对黄金分割比例进行研究(如图2),黄金分割指的是将一条线段AB分为AC与BC两部分,其中较长部分AC与整条线段AB的比值与较短部分BC与AC的比值相同,都是1:1.618,这个比例就是黄金分割比例,它是自然中一切事物最完美的比例。世界上有很多伟大的艺术品都是采用黄金分割比例制作出来的,比如达・芬奇的作品《维特鲁威人》、《蒙娜丽莎》以及《最后的晚餐》,这些画作都是采用黄金比例进行平面设计的代表作,在其他领域也有不少使用黄金分割比例的经典作品,比如:古希腊著名的雕塑“断臂的维纳斯”、“太阳神阿波罗”、古埃及的“金字塔”、巴黎的“圣母院”、法的“埃菲尔铁塔”等。

在黄金分割的比例下,我们能够得到很多的黄金分割矩形、三角形、椭圆以及螺旋线等,这些图形都具有极大的视觉审美价值,能够在保持原有的特性的前提下融人到更多的图案之中,让这些图案整体画面变得更加自然,更加协调,更具视觉审美特效。

2.3视觉美学中的动态矩形

除了我们上面所说的黄金分割比例,还有其他很多的无理分数比例的动态矩形也能够使人产生类似的令人愉悦的平面设计视觉审美,比如2、3、4、5等,这些矩形可以与黄金分割比例一起被统称为动态矩形,利用这些数值组合产生的图形总是与原始矩形的比例相同。

3平面设计视觉美学中的计算机辅助研究

3.1基于视觉美学的计算机辅助平面设计系统框架图幅分析

我们在进行计算机辅助平面设计时,首先要将图像导入到系统之中,把图像置于系统图层的最底层,保证在对图像进行分析时用到的辅助线、模板都在图像的上层。然后再把图层锁定,防止图像被篡改。在上述几步完成之后,可以对图像的属性进行图幅分析,判断出图像是横向插入还是纵向插人,计算出图像的插人点和长宽值,最终得出图像轮廓的比例。得出图像轮廓的比例之后,将所得到的比例值与2、3、4、5等动态矩形比例进行比较分析,判断是否符合这些动态矩形比例值,可以允许有较小误差,如果得到的比例值在某一个标准值附近,那么就可以计算出这个标准值的长宽值,并且利用这个长宽值对作品进行修改与调整,直到得到符合人们视觉审美习惯的作品为止。

3.2对计算机辅助平面设计作品进行分割线分析

当计算机辅助平面设计作品存在着明显的分割时,我们可以对平面设计作品中存在的直线系元素使用计算机辅助画出平面设计作品的分割线,然后计算出分割线与整幅图片以及分割线与分割线之间的比例关系。在对计算机辅助平面设计作品进行分割线分析时,可以进行连续分割线距离比例分析,求出相邻的两条分割线之间的比例关系,还可以进行连续分割线基准距离比例分析,求出各分割线相对于一个基准距离的相对比例。

如图4中的平面设计作品,我们已经对它进行了分割线的划分,这幅图包括图像轮廓在内一共有六条水平分割线,这六条分割线把这幅作品整体分成了五大部分,然后根据对它的连续分割比例分析,得出这幅作品基本上符合黄金分割比例。

3.3基于视觉美学的计算机辅助平面设计标准辅助线模板

在计算机辅助平面设计作品中,如果不存在分割线,或者需要对作品进行进一步的分割线比例分析,因为动态矩形本身具有一定的复杂性,所以单纯的人工很难判断出如何使用动态矩形的概念来辅助设计,这时我们就可以选择使用标准辅助线模板来寻找作品中蕴含的深层次比例关系。

在计算机辅助平面设计系统中,系统自带的有包括黄金分割2、3、4、5等比例的动态矩形以及很多种网格辅助线模板等,在进行作品设计时,我们可以根据需要选择不同的辅助线辅助进行平面设计。如图5、图6为利用2辅助线进行作品分析的模板,其他类型的辅助线使用方式可以参考此种模板进行使用。

计算机视觉与应用篇4

关键词计算机;图形设计;视觉传达系统

中图分类号:TP391文献标识码:A文章编号:1671-7597(2013)12-0031-01

目前来讲,计算机图形设计并非一个新鲜事物,因为在20世纪80年代,部分国家就利用计算机设计过图形。该设计方式传到我国,并展开了新的历程。而与计算机图形设计相比,视觉传达技术出现的时间更早,然而站在学科视角来讲,视觉传达依然属于较为年轻的范畴。视觉传达就是把视觉符号当作一个传达信息的通道,人类利用视觉符号展开信息共享与沟通,且该方式同样是人类信息资源传播中一种关键手段。根据有关数据统计,利用视觉传达系统传播的信息占人类信息的70%,然而由于在人类感官系统内,对外部环境中所传播的信息,视觉系统占有主要地位。因此,假使信息接收过程中,人类是依靠视觉系统完成的,并利用另一个感官完成其他信息的接收,如果两者之间发生冲突,人类的反应也会随之变化。

1计算机成图图形设计与视觉传达系统概述

1.1设计思路

在计算机成图图形设计与视觉传达系统设计过程中,设计人员不但要放开手脚,大胆做,还应该具有一定的弹性,不能被技巧与知识水平所制约,从而创造具有自身特点且与常规不符的作品,这无疑将成为设计的独到之处。通常情况下,人们将视觉传达系统设计当作一个展现思维的方式,尤其是在设计过程中把图形与文字有机结合,互相作用,且呈现出对方的优点,所以,视觉设计在对符号进行设计的过程中,应该尽可能对其进行优化,将符号自身的优点完美展现出来,进而在整体中表达其思想。

1.2设计技术与方法

设计工作者应该紧随时展的脚步,充分利用计算机这一先进科学工具,将最好的设计思想表达给大众。此外,由于全球信息技术的迅猛发展,在电影制作与广告方面,均要求运用到计算机成图图形设计,而且设计人员在设计时,也能利用不同的工具,对图形的清晰度进行适度的调整,进而让大众获得不错的视觉感受。

1)提炼客体。图形设计的创作来源主要是客体的表现以及对其的观察。然而在设计过程中必须抓住客体主要的特性,忽略不重要的特性,运用最简单的图形将其所包含的意思表达出来。设计人员在对客体进行提炼的过程中,不但要把握物体的共性,还必须注意其个性。图形设计在提炼客体时涵盖了两个方面的思想:提炼设计的任务;提炼和主题思想有关的图形。

2)重组图形。所谓的重组图形就是把图形中的构成部分进行科学有序的结合。图形的素材就好比是产品的原料,还必须对其进行生产加工方能成为最终的成品。其中最具决定性的一个部分就是图形结构的安排。对图形进行不一样的组合能够产生不同的图形,现今最为常见的重组形式有置换、同构以及轮廓线的矛盾、共生等等。所谓的同构就是将两个或两个以上的形象结合为一个统一的整体,其目的就是依托某个图形形象表现出其他图形的特点。在同构的作用,能够使图形形象更为厚重,有内涵,营造更为新奇的感觉。

2视觉传达系统内图形设计的特征

2.1明确的主题思想

设计人员在对图形进行设计的过程中,首先就必须对其基本内容进行规划,明确主题思想,也就是确定自身所要体现的核心内容。例如美的冰箱的广告都要求突出一个作用,即保鲜,那么设计人员在图形设计中必须抓住的关键思想就是鲜活,这一特征不但是该广告设计的目标,同时是图形设计的主题。而这个主题必须具备独特性,能和竞争对手区分开来,有助于大众去选择该产品。主题和图形应该相互作用,主题的主要载体就是图形,而图形的灵魂就是主题思想,主题思想通过图形体现出来。主题思想在初期形成过程中有很多因素都是不明确的,例如表达形式的多元化、视觉元素的多样化以及受众喜好的多样化等。以上述中“鲜活”主题来讲,运动场等视觉元素均能表达该特性,但在表达形式上可以采用不一样的方式,例如影构、置换以及同构等。另外,站在目标受众角度来看,家庭主妇是冰箱使用者,因此在设计过程中必须对其进行调查,了解其特征。设计人员将这些因素都结合起来,分析所要设计的主题,最后明确恰当的表达方式。

2.2图形设计的任务

在进行视觉传达系统设计过程中,每一个图形设计任务的提出均有一定的原因,例如商业广告的设计,它是在经济因素的基础上提出的;包装的设计,其目的是为了宣传企业文化、形象或者是打造产品形象;公益广告的设计,其目的向广大受众传播一种思想与信念。而所处社会的经济状况与大众的接受水平对图形设计任务的提出有一定的影响力。图形传播是在一定的社会背景下进行的,例如当时的风俗、文化等。在对图形进行设计的过程中,必须确保图形的内容和形式与上述客观背景相配合。

2.3形象生动

图形设计与绘画是不一样的,绘画时必须确保物和物的协调统一,因此画家在绘画过程中必须先了解所画物体的形象。但是图形则并非如此,图形设计必须选取大众所能接受的物体,这就说明图形设计过程必须选取生活中较为常见的物品作为载体,只有这样设计出来的产品方能让大众记住,并且让大众所理解其中的含义。

3结束语

总而言之,在当前社会,国家快速发展的主要源头在于科学技术的进步。在各行各业的发展当中,计算机成图图形设计与视觉传达系统设计得到了普遍的运用。所以,人们只有不断的对技术进行更新,不断的对视觉传达系统设计进行分析,进而将计算机成图图形设计运用到生活与工作中,促进社会的快速发展。目前各行各业都面临着巨大的压力与挑战,所以计算机图形设计应该与时展相适应,以便寻求更好的发展前景,尤其是在与视觉传达系统设计有机结合时,应该互相作用、互相影响,那么在不远的未来将会出现新的发展。

参考文献

计算机视觉与应用篇5

关键词:计算机视觉注意机制计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA(FocusofAttention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]WolfJM,CaveKR.Deployingvisualattention:theguidedsearchmodel.In:TrosciankoT,BlakeA,eds.AIandtheEye.Chichester,UK:Wileypress,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]RabakIA,GusakovaVI,GolovanAV,etal.Amodelofattention-guidedvisionperceptionandrecognition.VisionResearch,1998,38.

计算机视觉与应用篇6

1计算机视觉定义

人类天生具有五感,视觉便是其中之一,而计算机视觉,就是让计算机网络能够睁开眼看世界。让计算机有一定的视觉能力,可以从各个方面帮助人们进行监督、检验检测。利用计算机视觉科学可以使工作变得更加简便。计算机视觉主要应用于对二维码、条形码、照片、视频资料如片段等进行智能处理。

2计算机视觉研究在医疗、交通中的作用

随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。最常见的有癌细胞显微图像分割与识别、基于多特征融合的血红细胞识别和乳腺癌细胞计算机的自动识别等。计算机视觉技术的迅猛发展,为医疗诊断带来了很大的方便,同时促进了临床医学的发展。另外,在各大综合医院慢慢发展起的体检体系中,计算机视觉技术起到了决定性因素。随着体检的人数上升,对医院体检的管理、速度、准确性都提出了更高的要求。视觉识别轻而易举的解决了这个问题,只需要去识别体检人员的身份证,就可以将体检人员对号入座,检查过的项目,没有检查的项目一目了然。理化指标的检验,只需要在采血试管或采尿瓶上粘贴与体检者对应的条形码即可,利用视觉技术对号入座,方便而准确的确定每一位体检人员的血样及尿样。及提高了医院的工作效率,又将错误率降到最低。

计算机视觉在交通上同样得到了广泛的应用及发展。交通安全是交通运输中的重大问题,随着近年来机动汽车数量的迅猛增长,交通事故的发生也随之越来越频繁,给人类社会带来的危害也日趋严重,使很多的家庭失去亲人,甚至家破人亡。全国一线城市例如:北京、上海、广州、深圳等交通道路供需的矛盾日趋严重,交通安全、交通堵塞及环境污染已成为困扰我国交通领域的三大难题。基于图像处理的计算机视觉技术是通过摄像机获取场景图像,并借助于计算机软件构建一个自动化或半自动化的图像、视频理解和分析系统,并提供及时准确的图像、视频处理结果,以模仿人的视觉功能。主要功能如下:

一是基于计算机视觉技术的车辆牌照自动识别:车辆牌照是车辆的唯一身份,对车辆牌照的有效检测与识别在车辆违章检测、停车场管理、不停车收费、被盗车辆稽查等方面有着重要的应用价值。尽管针对车牌识别技术的研究相对成熟,然而在实际的应用场景中,受到天气、光照、拍摄视角、车牌扭曲等因素的影响,车牌识别技术仍然有一定的改善空间。

二是基于计算机视觉技术的车辆检测与流量统计:目前城市交通路口的红路灯间隔时间是固定的,而不同路段、不同时间段交通流量是随机变化的。若能根据各个交通路口的交通状况辅以计算机进行自动分析,并判断与预测交通流量,无疑为交通警察出警,红绿灯时间间隔的动态设置等提供技术支持。

三是基于计算机视觉技术的公交专用道路非法占道抓拍:公共交通是每个城市交通的重中之重,城市的公共交通为老百姓提供了便捷的出行方式。公共交通的发展,有利于城市的节能减排,有利于降低城市的空气污染指数。由于城市公共交通具有运量大、相对投资少、人均占有道路少等优点,解决城市交通问题必须优先发展城市公共交通。然而目前拥挤、缓慢的公交出行方式已成诟病,因此发展“快速公交”将是未来公交的一种运行模式。道路畅通则是发展“快速公交”的前提,相应地,公交专用车道的设定必不可少。为防止其他社会车辆的驶入,并对违规驶入的其他社会违规车辆进行抓拍与惩罚是保证公交车道公交车专驶的一种重要手段。因此在公交车前部装置摄像头并辅以其他处理设备,从而可以使得每一辆公交车成为了一个流动的监控设备。

3计算机视觉在条形码检测中的应用

条形码是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。在中国,由中国物品编码中心赋予制造厂商代码。那么最常见的计算机视觉应用与条形码检测就是在超市中。超市中每样产品都有自己的条形码,当人们选择了自己需要的物品后,来到收银台进行结账,我们会看见收银人员会用扫码器对物品的条形码进行扫描,扫描后就会出现产品的信息及价钱。记录以及扫描条形码的技术就是计算机视觉技术。

4计算机视觉重要技术——智能识别

近年来,基于生物特征的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。指纹、人脸功能已经大范围在生活中应用,其中很多单位的打卡制度就是依据面部识别、指纹识别来实现的。社会飞速发展的今天,很多的单位都实行了上下班打卡制度,这一制度已经被作为单位管理制度中的重要一条。购买的打卡机就是采用计算机视觉的重要技术——智能识别来实现的。利用打卡机的储存功能,记录每个职工的指纹或面部容貌,规定在某一个时间范围内对应识别指纹或面部容貌,视为打卡。在上下班打卡的过程中,员工将面部或指纹对应在打卡机的制定位置上,让打卡机进行识别,当识别的结果与存储结果相同时,打卡成功。这样看起来十分简单的打卡机可以使单位的工作有序化,制度化,而实现这个功能的技术就是计算机视觉技术中的重要技术之一:智能识别。

5计算机视觉技术的发展过程及未来

计算机视觉技术研究经历了近40年的过程,20世纪50年代的统计模式识别、60年代的Roberts的三围积木世界、70年代的Marr为代表的计算理论、80年代的主动视觉,但是仍然面临许多的问题。主要由于计算机视觉是一个逆问题,视觉信息多种多样,视觉知识的表达很困难,图像数据量巨大,信息存储于检索困难,对生物学、神经生物学等的研究有待深入。

计算机视觉技术的未来必定会朝着高科技发展,航空遥感测控地形地貌、电影特效制作、工业生产自动化检测、医学影像检测,再到天文领域等,在这些科学领域中计算机视觉将无法取代,成为主流的技术之一。

作者简介

    【公文范文】栏目
  • 上一篇:【荐】小学生清明节日记
  • 下一篇:最炫民族风串词6篇
  • 相关文章

    推荐文章

    本站专题