2025年6月3日,广州大学网络空间安全学院“方滨兴院士班”(方班)2024级的学子们齐聚广州大学黄埔校区B1栋109报告厅,迎来了本学期的第三十二期方班前沿秀。本次报告邀请到了清华大学计算机系教授,中国工程院院士郑纬民作为主讲嘉宾,以“关于人工智能大模型的几点思考”为主题,为在场的学子们带来了一场深入浅出、精彩纷呈的学术盛宴。
报告开始,郑纬民院士对人工智能大模型在 2025 年呈现出的两大特点进行了深入剖析。他指出,多模态融合是大模型发展的显著趋势,从最初仅能处理文本,到如今能够同时处理文本、图像和视频等多种模态的数据,这一跨越极大地拓展了大模型的应用场景与边界。同时,大模型与各行各业的深度融合成为另一大亮点,如金融、医疗、汽车、智能制造等众多领域都开始积极拥抱大模型技术,推动着产业智能化升级,助力 GDP 增长,这也标志着 2025 年成为大模型应用落地的元年。
随后,郑纬民院士详细拆解了人工智能大模型生命周期的五个关键环节,即数据获取、数据预处理、模型训练、模型微调以及模型推理。他强调,数据获取是整个流程的基石,海量且多模态的数据需从世界各地网站及各类终端设备中采集而来,并高效存储以便后续调用;数据预处理环节则聚焦于提升数据质量,通过去重、去广告、统一格式等操作,为模型训练提供 “干净” 数据;模型训练阶段,强大的算力支持与先进训练技术缺一不可,以产出高质量基础大模型;模型微调则是针对特定行业领域数据进行二次训练,使模型精准适配行业需求;最后的模型推理环节,关系到模型在实际应用中的表现与效率,推理速度与准确性至关重要。
报告尾声,郑纬民院士呼吁大家重视算法优化与软件生态建设。他强调,在硬件受限的情况下,通过算法创新与软件优化,能够以更少的资源达到与大规模硬件投入相当的效果,这对于我国在人工智能领域实现自主可控发展具有重要意义。他还提到,构建国产自主的软硬件生态系统迫在眉睫,包括打造兼容性强的硬件平台、开发高效的系统软件与工具链,以及培养一批精通国产软硬件生态的人才队伍,只有这样,才能在人工智能大模型时代占据主动,推动我国人工智能产业健康、可持续发展。
报告结束后,郑教授与方班同学们进行了深入的交流讨论,解答了同学们提出的疑问。同学们表示从郑教授的报告和讨论中受益匪浅,对人工智能大模型也有了更深刻的思考和认识,并对其未来发展充满了期待。
第三十二期方班前沿秀报告圆满落幕。
整理:刘佳扬 陈悦雯
校对:王乐老师 鲁辉老师 殷丽华老师
责任编辑:鲁辉老师
本课程最终解释权归蚁景网安学院
本页面信息仅供参考,请扫码咨询客服了解本课程最新内容和活动