作者:记者 叶满山 来源: 发布时间:2026-4-16 23:28:41
选择字号:
王飞:让 AI 技术从实验室走向应用场

   王飞,西安交通大学人工智能与机器人研究所教授、博士生导师。主要从事视觉智能处理器设计、计算机视觉、模式识别与智能系统研究。现任视觉信息与应用国家工程研究中心副主任、西安交通大学空间视觉联合实验室主任、中国图象图形学学会视觉传感专业委员会主任、中国机械工程学会空间机构分会委员。发表高水平国际期刊和会议论文160余篇,获发明专利授权28项、软件著作权10余项,参与制定行业标准3项,承担国家级重大专项2项,研究成果多次获省部级及以上奖励。

 

   从空间视觉智能突破到以人为中心的人工智能(AI)探索,王飞深耕科研与教育一线二十余载,见证并推动了中国智能感知领域从理论探索到重大工程落地的跨越式发展。 

   面对航天强国建设与AI产业升级的迫切需求,他聚焦智能感知核心方向,攻克空间目标三维位姿估计、开放域泛化感知、非接触式高精度感知等关键技术,成果成功应用于载人航天、探月工程等国家重大任务,填补国内技术空白,同时搭建“科研—教学—实践”联动育人体系,为国家培养了大批航天与AI领域的复合型技术人才。

 

   《科学新闻》:您长期聚焦智能感知与以人为中心的AI领域,这些研究背后贯穿的核心学术思想是什么?这一思想是如何指导您解决开放域泛化感知、跨模态数据融合等关键技术难题的?

   王飞:我们的研究始终聚焦计算机视觉,核心思想是“以人为核心的模仿与桥梁构建”——先理解人类感知与认知过程,再将其转化为计算机可执行的逻辑,让机器具备类人视觉感知能力。目前AI仍处于“模仿人类”阶段,因为我们尚未完全搞透人类视觉机理,如目标检测、图像识别等任务。早期长期以人类识别率为标杆,直到深度神经网络出现才实现突破,如在ImageNet数据集上识别率超人类,但本质仍是“以人定标”。

   至于开放域泛化感知,这是当前未解决的难题,也是未来方向。现在工业、军事等场景多是“封闭域”——目标类型有限,如工业产品、敌方武器,但人类是“开放域感知”:孩子学过纸上数字后,能直接识别车牌数字;而计算机训练了印刷体数字,遇到手写体或带划线的“99分”就会失效。开放域的核心难点是让机器先“确认未知目标存在”,再判断是否为已知类别,但目前受限于数据依赖,比如训练1万张猫的图像,遇到马可能会误判为虎斑猫。

   跨模态数据融合则是在多模态基础上,实现不同类型模态的关联,如语言与图像特征的跨越。比如,用语言描述“马有四条长腿、面部有鬃毛”,再关联图像特征,让机器即使没学过马,也能通过语言特征匹配图像区域。但目前我们做得不多,因为跨模态需要海量数据,如文字需多语言数据、图像需多场景数据,模型复杂且算力需求极高,现有条件只能先尝试两种模态的底层逻辑研究,暂未大规模落地。

 

   《科学新闻》:未来,您认为智能感知领域最可能出现哪些突破性进展?这些进展将如何赋能智慧医疗、智能家居等实际场景?

   王飞:大模型一定是未来方向,但会经历“基础模型+二次优化”的进化过程——就像建房子,大模型提供“毛坯房”(基础框架),用户用专业数据“装修”(二次训练),适配具体场景。比如医疗领域可基于通用医疗大模型,用某类疾病的专属数据优化,提升诊断精度。

   这些进展对场景的赋能很明确。在智慧医疗方面,能打破资源不平衡,如通过数字切片扫描+AI模型,让偏远地区医院将肿瘤切片数据传至中心平台,由AI辅助诊断,实现“医疗公平”,甚至未来远程手术机器人能让基层医院拥有北京专家级水平。在智能家居方面,可通过移动热点信号、红外等非接触感知,无感判断用户位置与状态,自动触发服务,无需手动指令。

 

   《科学新闻》:您曾参与载人航天、探月工程等国家重大任务,在解决航天领域空间视觉智能相关“卡脖子”问题时,高校科研团队应如何平衡基础理论探索与重大需求落地的关系?有哪些关键经验可分享?

   王飞:核心是“理论见底+双团队并行”。2007年我们承接空间站机械臂视觉感知任务时,先从理论上“挖透根”——按用户要求做到“技术见底”,确保无理论漏洞;再组建“基础研究团队”与“工程化团队”,前者负责前沿理论突破,后者专注于落地,且要求双方共同参与讨论,互相熏陶。

   关键经验有三点。一是团队稳定性,学生是“流水兵”,需靠专职工程师保障技术延续,我们团队离职率不到10%,最长任职15年;二是制度变通,如学校通过科教院设立“类劳务派遣”机制,让工程师享受部分校内资源,解除后顾之忧;三是理论超前,我们当时能拿下任务正是因为研究比同行超前,且工程化时不局限于当前需求,同步对接国际前沿。

 

   《科学新闻》:国家人工智能产教融合创新平台聚焦AI芯片、工业AI等方向,您认为这类跨方向协作应如何打破技术壁垒,实现从实验室成果到产业级应用的高效转化?

   王飞:关键是建立“场景化过渡带”和“统一价值认知”。比如,广州日产的AEP中心搭建与生产场景相似的实验环境,由专职工程师配合科研团队试错,我们的产品在那验证一年后才上线,既不影响生产,又能积累数据。但国内很多企业缺乏这种过渡带,要么要求“拿来就用”,要么不愿承担试错成本。

   另外要解决“价值认知差”。高校前期研发投入大,期望高回报,而企业想压缩成本,比如曾有企业只愿出200万买断千万级成果,导致转化卡住。建议借鉴“分成模式”或国家补贴,同时企业需意识到,AI芯片、工业AI等方向需长期投入,不能只看短期利益,比如AI芯片要突破图形处理器局限,做专用芯片,工业AI要适配全链条场景,这些都需要跨方向协作,共享数据与算力。

 

   《科学新闻》:恰逢西安交通大学建校130周年,西迁精神与学术传统对您的研究方向选择、学术态度塑造产生了哪些深远影响?如何依托智能感知等优势方向进一步强化学科特色,为AI学科跻身国际一流贡献力量?

   王飞:西迁精神对我最大的影响是“踏实干事、家国情怀”。西安交通大学地处西北,外界诱惑少,学生更能沉下心钻研,这也是很多航天、军工用户愿意与我们合作的原因,他们认为交大人不浮躁、能扛事。比如我们早期承接航天任务时,没钱没设备,老师从研究所经费里拨出三四十万元支持,靠的就是“国家需要就是我们的需求”的信念。

   未来学院要从三方面发力。一是巩固“全链条优势”,从智能感知理论到AI芯片、系统、装备,打通从实验室到应用的链路,避免核心器件依赖国外;二是强化“具身智能”研究,聚焦封闭域场景,做“小而精”的专用模型,与开放域研究形成互补;三是延续“反哺文化”,鼓励毕业学生带资源回流,通过“师生—工程师”融合机制,培养更多能扛重压、解决实际问题的人才,而不只是“螺丝钉”。■

 
 
 打印  发E-mail给: