从感知型摄像机看图像识别技术的行业应用
|
1、 图像识别是重要的人工智能分支 近一两年来,人工智能领域得到了媒体界、产业界和学术界等前所未有的关注,大家一致认为智能化时代正在到来,机器正在越来越多的取代人类特有的优势和技能,而其中最为重要的可能就是图像识别技术。 图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。简单来说,就是让机器能够通过对感知信息的处理像人类一样读懂图片的内容,而不是只看到像素。目前,伴随着图片成为互联网中的主要信息载体,难题随之出现。当信息由文字记载时,我们可以通过关键词搜索轻易找到所需内容并进行任意编辑,而当信息是由图片记载时,我们却无法对图片中的内容进行检索,从而影响了我们从图片中找到关键内容的效率。图片给我们带来了快捷的信息记录和分享方式,却降低了我们的信息检索效率。在这个环境下,计算机的图像识别技术就显得尤为重要。 计算机视觉有着广泛应用,其中包括,医疗成像分析被用来提高疾病的预测、诊断和治疗;人脸识别被Facebook用来自动识别照片里的人物;在安防及监控领域被用来指认嫌疑人;在购物方面,消费者现在可以用智能手机拍摄下产品以获得更多购买选择。 我们在图像识别领域的研究有着众多突破性进展,Facebook人工智能负责人YannLeCun发明的卷积神经网络促使整个人工智能领域在近期出现了快速发展,而其最重要的应用就是图像识别和语音识别。2012年一支由吴恩达领导的谷歌团队展示了一个无监督学习的机器对数百万张YouTube视频图像的分析。这个机器学会了给它见过的常见物体进行分类,包括人类面孔和(供网民娱乐的)猫,包括网上随处可见的各种动作:睡着的、跳跃的、玩滑板的。人类没有在这些视频上标明包含“面孔”或“猫”的字眼。相反,机器在看了每个物体不计其数的例子后简单断定,它们表现出来的统计模式已经具备了足够的普遍性,从而可以将这些物体进行分类。斯坦福大学Andrej Karpathy和李飞飞发表的论文描述了一个计算机视觉系统可以标出一个给定图像的特殊部分。例如给它看一个早餐桌子,它可以识别出餐叉、香蕉片、一杯咖啡和桌子上的花以及桌子本身。它甚至可以在场景中用自然英语做出描述——尽管这项技术还不是特别完美。 2、应用场景决定着图像识别技术的普及程度 MIT宇宙学家Max Tegmark说,人工智能的运作已处于走出实验室进入社会的阶段了。我们目前确实看到甚至使用到了许多人工智能服务和产品,比如说更好的搜索引擎服务,语音助手等等。在和图像识别技术有关的细分领域,这样的服务和产品也非常多,比如说以图搜图、图像对比、人脸识别、图像自动分类,等等。但我们虽然看到了如此多的产品或功能,但却没有发现将图像识别进行通用化的应用。许多国内外的创业公司,甚至是科技巨头在图像识别领域也没有找到最具爆发性和发展前景的应用方向。这其中的原因就在于应用场景的缺失。 |








