广告
首页 > 电子市场商情 > 台湾人工智能发展的挑战和发展空间

台湾人工智能发展的挑战和发展空间

人工智能(AI)可以在许多领域实现,未来机器人将能够为人类做很多事情。美国西雅图华盛顿大学(UW, USA)电气与计算机工程(ECE)教授、信息处理实验室(IPL)主任黄仁能博士参与了渔业电子监测等多个AI项目(美国NOAA)、自动驾驶(美国思科)、智能交通与智慧城市(韩国ETRI)、自动高尔夫挥杆分析(美国Sportsbox AI)、多摄像头多人追踪长护中心监控( Quanta Computer, Taiwan),晶圆缺陷分类(Vanguard International Semiconductor, Taiwan)等。

人工智能(AI)可以在许多领域实现,未来机器人将能够为人类做很多事情。美国西雅图华盛顿大学(UW, USA)电气与计算机工程(ECE)教授、信息处理实验室(IPL)主任黄仁能博士参与了渔业电子监测等多个AI项目(美国NOAA)、自动驾驶(美国思科)、智能交通与智慧城市(韩国ETRI)、自动高尔夫挥杆分析(美国Sportsbox AI)、多摄像头多人追踪长护中心监控( Quanta Computer, Taiwan),晶圆缺陷分类(Vanguard International Semiconductor, Taiwan)等。0Pqesmc

对于具有人类感知能力的机器人,开发者需要花费大量的时间来收集数据并迭代AI训练过程。Hwang 说,他几乎参与的项目之一与增强美国海关与边境保护局 (CBP) 的能力有关。0Pqesmc

更具体地说,人工智能可用于检测旅行者在面对面采访中的谎言,例如使用测谎仪但无需在旅行者身上附加设备,希望人工智能可以通过摄像头和麦克风扫描帮助 CBP 官员更有效地工作。然而,地面实况所需的数据很难分类和验证。问题是:哪些数据点是真的,哪些是假的?0Pqesmc

Hwang 说,基于深度学习的人工智能很难培养人文常识。人类从他们的生活经历中学习,有些人可以感觉到环境、他人的肢体语言和态度的最细微变化,甚至有时,我们依靠直觉来做出决定。机器人,即使具有训练有素的大输入卷积神经网络,也不会像人类那样“感知”,而它们只是能够观察训练有素的逻辑思维过程。例如,Hwang 补充说,“人工智能赢得围棋比赛比感知面前人的情绪或想法要容易得多。”0Pqesmc

开放式长尾识别 (OLTR)

现实生活中的视觉对象识别任务是计算机视觉中最基础和实质性的研究之一,横扫物种识别、医学影像感知、人脸识别和自动驾驶场景分类等各个领域。然而,在在实际应用中,基于深度学习训练的现成目标识别方法的性能大多偏向于训练集中样本丰富的多数类,而对样本少的少数类的分类能力有限类,更不用说训练数据中从未见过的新类对象,即实际对象样本分布不均,对象类总是开放式的,即所谓的开放集长尾识别(OLTR)。0Pqesmc

Hwang 和他的团队提出了一种单阶段 LTR 方案:“盟友互补专家 (ACE)”,其中基于卷积神经网络 (CNN) 的专家接受了多样化但重叠、不平衡的子集的训练,以从主导部分的专业化中获益并在所有基准数据集上实现最先进的 LTR 性能。他的团队进一步提出了一种度量学习框架,称为“在熟人附近定位不熟悉(LUNA)”,以定量衡量新颖性水平。LUNA 基于深度 CNN 特征的局部密度,是一种非常有效的开放集识别 (OSR) 解决方案。0Pqesmc

域和标签转换

他在美国政府国家海洋和大气管理局 (NOAA) 工作了 10 多年的项目之一是帮助渔民使用部署在渔船上的单目摄像头自动计数、测量尺寸,并识别出 100 多种直接在海中捕获的鱼类。Hwang 说,一旦渔船移到不同的水域,域和标签就会发生变化,即捕获的鱼的外观和分布发生变化。此外,可能存在在其他水域从未见过的鱼类,并且由旧数据集训练的 AI 模型将无法应用或发挥作用——这是一项现实世界的 OLTR 任务。0Pqesmc

Hwang 的团队现在正在努力工作,以系统地调整训练有素的 AI 模型,以识别具有域和标签变化的新鱼。0Pqesmc

人工智能项目要取得成功,除非采用一些不太有效的半监督或自监督学习技术,否则人工智能公司或实验室将需要投入大量劳动力来收集训练数据并为监督学习生成注释。Hwang 说,这很耗时,一开始需要高昂的人工成本,但“最终,一旦标记完成,经过训练的 AI 模型的效率将显着提高。”0Pqesmc

零样本学习

Hwang 表示,使用 transformer 神经网络——最初由 Google Brain 于 2017 年基于高度并行的自注意力机制引入自然语言处理——可以为一系列文本单词(语言句子)生成非常有效和信息丰富的嵌入特征。这种额外的训练并行化允许在更大的数据集上训练 transformer,从而开发出预训练的 transformer 系统,这些系统可以用更小、更集中的训练数据进一步微调,以完成更具体的任务,最近 GPT 的成功证明了这一点。 3 用于在给定初始文本作为提示的情况下生成类人文本,而 ChatGPT 是有史以来发布的用于类人交互的最佳 AI 聊天机器人。0Pqesmc

随着转换器在图像和视频等视觉数据中的扩展应用,现在可以同时训练两个独立的转换器:一个用于图像,一个用于相应的描述性文本,具有数亿个训练图像-文本数据对,并允许基于所谓的对比学习策略,生成的图像嵌入特征与相应的文本嵌入特征紧密对齐,由此产生的系统可以有效地从自然语言监督中学习视觉概念,并且可以应用于任何视觉分类基准,而无需进一步微调新基准应用程序的训练数据,即零样本学习。0Pqesmc

台湾人工智能发展的挑战

越来越多的传感器被大规模部署在各种设备上——从智能手机、家用电器、工厂或实验室设备、电动汽车,到所有物联网电子产品和公共基础设施——从世界几乎每个角落收集了大量数据。0Pqesmc

Hwang 表示,数据采集、网络连接和计算能力是人工智能项目成功的三大支柱,并指出人工智能在中国和美国取得了快速进展,他们认为这项技术对促进国民经济增长和提高竞争力至关重要。0Pqesmc

随着世界从 4G 到 5G,再到 6G,发达国家的连通性不成问题,但低收入国家仍然缺乏网络基础设施。另一方面,AI 开发人员经常发现自己无法获得足够的高性能计算能力。例如,尽管台湾政府为研究目的和应用提供了 1,000 个 V100 GPU,但对高性能 GPU 的需求仍未得到满足。0Pqesmc

此外,对于使用多个基于物联网传感器的解决方案的高级自动驾驶等复杂项目,数据收集和标记需要大量的劳动力、时间和投资,以保持模型训练的有效性和持续性。0Pqesmc

台湾是一个用户基数小的小市场,几十年来,该国一直非常重视和专注于制造硬件。半导体代工、电子制造以及其他硬件和物联网传感器组装已经相当成功——然而,这对软件和人工智能行业的发展应该是一个好处而不是障碍。0Pqesmc

随着制造能力的增强,Hwang 认为硬件和人工智能软件的系统集成值得投入时间和金钱——从物联网传感器数据采集、5G/6G 移动边缘数据网络,到基于大规模基础设施的 CPU/GPU 支持。0Pqesmc

责编:EditorTiger
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

为你推荐

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>