时间: 2025年6月27日(周五)下午15:00-17:00
地点: 校本部东区翔英大楼808
讲座: 视觉大模型研究进展及发展趋势
演讲者: 程建 教授,电子科技大学
演讲者简介:
程建,男,1978年8月生,教授,博士生导师,电子科技大学信息与通信工程学院计算机视觉与机器智能实验室负责人,主要研究方向为:人工智能、计算机视觉、机器学习等。2006年9月毕业于上海交通大学图像处理与模式识别研究所,获模式识别与智能系统专业博士学位。2022年作为中组部、团中央第22批博士服务团成员援藏。主持承担国家及省部级项目10多项、企业横向科技合作项目近20项;参与国家及省部级项目近10项。在IEEE T Cybernetics、IEEE TIP、IEEE TMM、IEEE TAES、IEEE TVT、IEEE TCSVT、ISPRS、CVPR、AAAI、ACM MM、IGARSS、BMVC、ICIP、ICPR等国际学术期刊和会议上发表论文150多篇,其中SCI收录50多篇,EI收录80多篇;获IEEE信号处理协会2023年最佳论文奖;申请国家发明专利80多项,其中已获得国家发明专利授权50多项。
讲座摘要:
视觉大模型作为人工智能领域的重要研究方向,近年来在技术架构、应用场景与产业落地方面取得了显著进展。基于Transformer架构的视觉大模型通过自注意力机制与多模态融合技术,显著提升了图像识别、目标检测与语义分割等任务的性能,为计算机视觉领域带来了新的技术突破。然而,视觉大模型的发展仍面临计算资源消耗大、数据质量与对齐难、可解释性不足等挑战。本次报告将围绕视觉大模型的技术演进、核心突破、应用场景及未来趋势展开,系统性地探讨视觉大模型的研究现状与发展趋势。
邀请人:通信与信息工程学院 刘志老师
欢迎广大教师和学生参加!