AI大模型助力机器视觉开拓非标准化应用场景-国际电子商情

契机出现在2022年11月底，由于ChatGPT爆火而“出圈”，各界探索“AI大模型+行业”的热度高涨。对属于人工智能(AI)分支的机器视觉而言，“大模型+机器视觉”的探索也带来一些新机遇。

现在大家讨论机器视觉，已经不再聚焦“它是否能取代人类视觉”来展开，因为机器视觉过去多年的发展，已向大家充分证明了它的高效率。ruEesmc

不过，目前机器视觉在各行各业的应用，主要聚焦在3C电子、汽车制造、半导体、光伏、锂电、物流/包装行业等标准化、自动化极高的应用场景。ruEesmc

其实，在市场中还有许多非标准化的应用场景，比如，农产品检测、机车车下零部件巡检等，这些市场虽然看上去并不算太大，但累加起来的规模不容忽视。ruEesmc

在工业领域，各细分行业之间可谓千差万别。对于机器视觉系统而言，每一项工序都需大量计算来支撑，这对于许多细分领域的企业来说，“砸钱”从零开始训练机器视觉系统既费时又烧钱，一般的小企业难以承受这种压力。就算有细分企业愿意投钱训练模型，也会受限于可供训练的样本少，而较难以有突破。ruEesmc

契机出现在2022年11月底，由于ChatGPT爆火而“出圈”，各界探索“AI大模型+行业”的热度高涨。对属于人工智能(AI)分支的机器视觉而言，“大模型+机器视觉”的探索也带来一些新机遇。ruEesmc

AI大模型赋能机器视觉

机器视觉系统通常由照明光源、光学镜头、摄像机、图像采集卡、图像检测软件、监视器、通讯单元等组成，该系统可满足实时监控、自动化控制和图像识别等需求，适用于智慧工厂、智慧交通、智慧城市等场景。ruEesmc

这其中的每一个组成单元，都可能会影响整套系统的精度。比如，硬件的质量和参数会直接影响图像的分辨率、清晰度、对比度、噪声等；软件的逻辑和效率也会影响图像的处理速度、准确度、稳定性等。ruEesmc

·以前靠全局快门、HDR提升精度

在AI大模型爆红之前，就存在许多提升机器视觉检测精度的方案，其中包括使用全局快门图像传感器、利用高动态范围(HDR)等。ruEesmc

高速运动物体造成的形变伪影可能产生的误差，将在机器视觉场景下被无限放大，全局快门拥有高帧率、无畸变的特点，这使之非常适合工业面阵应用和智能交通系统，包括安森美、意法半导体、思特威等公司，均有应用于机器视觉的全局快门图像传感器方案。ruEesmc

安森美总裁兼首席执行官Hassane El-Khoury曾在几年前的一次媒体沟通会上强调，公司在工业生产中的机器视觉应用方面非常重视全局快门技术。他认为，该技术是实现最快吞吐量的技术，能够捕捉到快速移动的物体，同时产出非常清晰的图像，适用于库存管理、实时质量检测、质量控制等应用。ruEesmc

El-Khoury指出，工厂在智能制造方面需要提高作业的效率，需要提高自动化，所以其吞吐量上涨非常快。为了使得生产线赶上吞吐量的增长，需要生产线具备全局快门的技术和能力，不管是库存管理、质量检测，还是在其它工业自动化方面，都能够得到更好的满足。ruEesmc

采用全局快门只是提升机器视觉系统精度的一种方式，另一种方式是利用HDR。简单地说，动态范围是指相机捕捉场景明亮和黑暗区域细节的能力，更高动态范围的相机产生的图像具有更真实的照明和更少的高光溢出或丢失的阴影。比如，豪威科技在2023年5月底发布的OV02E，是一颗具有交错式HDR的全新1080P全高清图像传感器，适用于需要深度检测的机器视觉和物联网应用。ruEesmc

不过，在一些光学成像环境相对复杂，或者瑕疵类型很难被明确定义的场景中，机器视觉设备难以达到检测要求的混检场景，仍然依赖人工进行视检，这个问题依然需要研发人员来解决。ruEesmc

所幸的是，在大模型走红之后，我们看到了更多的可能性，也有了更多的选择。ruEesmc

·SAM模型横空出世

2023年4月6日，Meta AI公开了Segment Anything Model(SAM,分割一切模型)。SAM使用了分割数据集SA-1B，其内包含了1,100万张图像，总计超过10亿张掩码。SAM架构主要包含三个部分：图像编码器；提示编码器；以及掩码解码器。ruEesmc

该模型在训练时被设计为交互性的可提示模型，因此可以通过零样本学习转移到新的图像分布和任务中。由于其底层以NLP模型的通用方式，解决图像分割和识别问题，所以SAM模型可应用于各种领域，用于查找和分割图像中的任何对象。SAM模型极大地降低了图像处理的门槛，是机器视觉领域的底层突破性技术。ruEesmc

SAM模型可以看作是一种通用模型，它是可处理多种不同类型任务的AI模型。而专门处理某一种类型任务的AI模型，则被视为专有模型。当然，通用模型处理过的任务在精度上一般低于专有模型。ruEesmc

SAM模型虽然无法一步到位把任务处理得十分完美，但是它如此受机器视觉领域关注，是因为它的出现给业界树了一个新范式。以前面对不同的任务需求，开发者要从零开发不同的专有模型，而现在开发者只需在SAM模型基础上进行优化，让它更加符合自己的任务要求，这样可节省时间成本和资金成本。ruEesmc

对于需要应用机器视觉技术的自动驾驶、智慧交通、智能安防、智慧城市等领域，此前这些领域因为长尾场景过多，需贴大量数据标签，导致其训练成本高昂，而有了SAM这种通用的图像分割模型之后，以上领域的相关定制产品成本会降低。ruEesmc

另外，那些由于样本量少而难有突破的领域，也会迎来新的发展，比如非标准化应用场景。前文提到的农产品检测、机车车下零部件巡检等细分领域，未来我们将看到机器视觉将应用到更多新的领域中来。ruEesmc

AI视觉SoC开始出现

随着多模态大语言模型的问世，机器视觉市场迎来了新的机遇和变革。市场上开始陆续出现AI视觉SoC，它在SoC中添加了AI功能。因为在为非AI应用构建的SoC上实现视觉、语音识别和其它深度学习/机器学习算法时，SoC的资源会不够用，所以开发者选择和整合IP，确定了AI SoC的基础效率，构成了AI SoC的本征特性。随着AI SoC的复杂性不断增加，这种使用工具、服务和专业知识来降低功耗、提升性能和削减成本变得益发重要。ruEesmc

安霸半导体软件研发总监汤坚表示：“如果说，在机器人市场，传统的视觉SoC是机器人的‘眼睛’，给机器人带来环境感知能力。那么AI视觉SoC则是机器人的‘眼睛+大脑’，给机器人带来环境感知、信息处理、分析决策等多种更复杂的能力。有了AI视觉SoC的加持，机器人也将变得越来越智能。”ruEesmc

目前除了安霸半导体之外，还有中国大陆的爱芯元智、亿智电子等也有发布AI视觉SoC产品。同时，从AI视觉SoC这类芯片可以看出，随着AI进一步深入发展，我们也会在市场上看到更多其他不同种类和用途的AI芯片诞生。ruEesmc

小结

实际上，直到近年来，伴随AI、深度学习等技术快速发展，机器视觉技术才有更进一步的发展。ruEesmc

比如说，除了前文提到的细分领域之外，生物/3D脸部识别也是一个机器视觉的应用，目前已经广泛应用于智能手机、笔记本电脑、个人平板、智能手表、智能门锁、考勤机、自助付款机等，还有汽车类的智能座舱、医疗类的自动测温仪等设备。ruEesmc

随着通用大模型的进一步普及，未来还会有更多领域的企业，在通用大模型基础上训练自己的专有模型，从而把机器视觉推向更深、更广的市场。ruEesmc

责编：Clover.li

本文为国际电子商情原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

李晋

国际电子商情助理产业分析师，专注汽车电子、人工智能、消费电子等领域的市场及供应链趋势。

进入专栏

业界新闻人工智能

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

英集芯取消并购辉芒微
国际电子商情讯，3月17日晚间，深圳英集芯科技股份有限公司发布公告称，公司决定终止购买辉芒微电子（深圳）股份有限公司控制权，公司芯股票自2025年3月18日开市起复牌。
2024年全球IC设计公司营收TOP10揭晓
全球前十大IC设计公司全年营收合计达2498亿美元，同比激增49%。其中，英伟达以1243亿美元营收蝉联榜首，占据前十总份额的50%，与其他厂商形成断层式差距。
奥迪宣布裁员7500人！电动化转型遇阻，缩减用人成本
继宝马、奔驰裁员之后，奥迪也开始宣布裁员。
加码国产化！思远凭借DDR5 PMIC跨界存储赛道
最近，国产存储领域出现了一个新进者——思远半导体。这家在智能穿戴、TWS耳机、移动电源、BMS等领域深耕十数年的电源管理芯片(PMIC)Fabless，如今把业务范围成功地扩展到了存储电源领域。
突发！华大九天出资收购芯和半导体控股权
3月17日午间，华大九天发布公告称，正在筹划通过发行股份及支付现金等方式，购买芯和半导体的控股权，其股票自当日开市时起开始停牌，预计在不超过10个交易日的时间内披露本次交易方案。
四部委联合发布《人工智能生成合成内容标识办法》
近日，国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》（以下简称《标识办法》），该办法自 2025年9月1日起正式施行。
再次挥舞制裁大棒，美国意欲脱钩中国锂电池
日前，美国国会众议院以口头表决的方式一致通过了编号H.R.1166的《与依赖外国对手电池脱钩法》，禁止美国国土安全部采购宁德时代、比亚迪、远景能源、亿纬锂能、海辰储能和国轩高科六家中国企业生产的电池。
促进人工智能+消费！国家提振消费专项行动方案来了
2025年3月16日，中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》并发出通知。其中涉及到“人工智能+”行动，促进“人工智能+消费”。
苹果iPhone 17 Air新爆料：厚5.5毫米，无SIM卡槽
国际电子商情讯，据彭博社资深记者马克·古尔曼（Mark Gurman）最新爆料，苹果正秘密打造一款颠覆性产品——iPhone 17 Air，该机型将以“史上最薄iPhone”姿态冲击市场，该机型将无SIM卡槽，机身厚度仅5.5毫米，较现有iPhone薄约2毫米。
微软断供！华为再无Windows可用，鸿蒙PC要来了吗？
"以后只有用我们的鸿蒙PC了。”
传长江存储4月涨价，涨幅或超10%
国际电子商情讯，继闪迪、美光宣布涨价之后，业内也传出长江存储也将涨价。根据中国闪存市场报道，根据渠道反馈，长江存储零售品牌致态也将于4月起面向渠道上调提货价格，幅度或将超过10%。
首款原生鸿蒙正式版手机要来了！DeepSeek加持
“全国人民买得起、想不到的产品”

英飞凌预计2025财年AI业务营收将突破6亿欧元，未来两年内有望超10
美通社消息，3月14日，“2025英飞凌消费、计算与通讯创新大会”（ICIC2025）在深圳举行。本届大会汇聚600多位业界精
湖南公布电子信息制造业重点项目，涉13个MLED、显示类项目
近日，湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》，涵盖先进计算、音视频、新一代半导体、人
总投资7.6亿，惠科东莞平板显示项目二期开工
3月15日，质鼎集团公众号消息，惠科东莞平板显示集群电子商务项目二期正式开工。
中国台湾20家电子企业2024年第四季度和全年财报汇总，富士康、台积
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
全球LED显示屏市场机遇与挑战分析
近年来，LED显示屏市场持续演进。回顾2024年，行业呈现出哪些发展态势？展望2025年及未来，市场又将面临哪些机遇与
索尼发布全新RGBLED背光技术
近日，索尼正式发布新一代RGBLED背光技术系统，可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产，并将
AI爆发，本土先进封装如何突破？
AI芯片是半导体最大的增长点，先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元，而用先进封装
欧美车用固态电池验证加速，预计最快2026年逐步实现量产
截止2024年底，17家欧美固态电池企业融资总额已突破42亿美元。
中国半导体走向幕后时代
曾几何时，中国半导体几乎不断有大基金投资、大项目上马，以及美国制裁的新闻。长期处于聚光灯下，中国半导体成为
Dynabook（原东芝PC部门）在退出10年后重返美国消费市场
Dynabook在退出十年后宣布重返美国消费市场。
中国大陆PC市场出现反弹，预计2025年将实现3%的增长
Canalys最新数据显示，受到消费需求激增8%的推动，2024年第四季度中国大陆的PC市场开始复苏，同比增长2%。
受苹果手机年末生产高峰及中国补贴政策带动，4Q24智能手机产量季增
根据TrendForce集邦咨询最新调查，2024年第四季由于Apple（苹果）手机生产进入高峰，以及中国部分地方提供消费补贴

德州仪器推出全球超小型MCU，助力微型应用创新
德州仪器近日推出了全球超小型 MCU，进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
芯向未来，2025英飞凌消费、计算与通讯创新大会成功举办
创新是企业持续发展最大的价值。
闪迪独立上市后首秀“肌肉”: UFS 4.1新品、企业级SSD满足云到端
“闪迪(Sandisk)又回来了！”在3月12日的存储年度盛会CFMS MemoryS 2025上，闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出MM8102 Wi-Fi HaLow芯片，推动物联网新浪潮
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统（Soc），开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
存储大佬们都说了啥？MemoryS 2025 产业大咖演讲内容合集
CFMS | MemoryS 2025已圆满落幕，期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
安森美推出面向工业应用的先进深度传感器
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米，提高工业环境中的生产效率和安全性
西部数据推出大容量存储方案，赋能NAS用户、创意专业人士与内容创
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵，赋能数据存储拓展与生产力跃升
恩智浦发布全新一代S32K5微控制器系列，推进SDV区域控制架构发展，扩
全新一代MCU可以满足各种区域控制架构和电气化系统需求，助力汽车制造商向软件定义汽车（SDV）过渡。
将出色的高
【原厂入驻】聚洵半导体现已入驻iCEasy商城！
聚洵半导体科技（上海）有限公司（Gainsil Semiconductor Technology)于2016年成立于上海张江科学城，是一家全球
4月必逛电子展！六大热门新赛道，来NEPCON China 2025一展全看
领域新成果领域新成果4月必逛电子展！AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道，来NEPCO
英飞凌成为全球首个在安全控制器中采用后量子加密算法而获得Comm
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
踏时代之浪，共绘创新可持续新篇章
英飞凌坚信低碳化和数字化是未来十年的关键驱动力，半导体在应对能源挑战和推动数字化转型中扮演着重要角色。

AI大模型助力机器视觉开拓非标准化应用场景

AI大模型赋能机器视觉

·以前靠全局快门、HDR提升精度

·SAM模型横空出世

AI视觉SoC开始出现

小结

杂志声明