2023级计算机科学卓越班本科生论文被计算机视觉领域顶级会议CVPR收录

近日,计算机视觉与人工智能领域国际顶级会议CVPR 2025已放榜,我院2023级计算机科学卓越班本科生欧阳子恒为第一作者的学术论文《K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs》被该会议主会接收,科研导师为侯淇彬副教授。CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)是计算机视觉领域的国际顶级会议,位列中国计算机学会CCF-A类推荐榜单。本届会议共收到有效投稿13008篇,录用2878篇,录用率为22.1%,为近些年最低。

在计算机视觉领域,如何将个性化物体与多样化风格完美融合始终是研究热点。先前方法探索了部分使用LoRA融合物体风格的方法,但可能出现主体变形失去辨识度或者风格细节模糊的情况。同时,现有技术存在重新训练或复杂调参的问题,需要较多算力成本。

针对这一问题,该论文提出K-LoRA方法,在生成图片的过程中使用 ①绝对值矩阵的 Top-K 元素用于初步判断权重的重要性和②缩放因子 S 用于调整和平衡内容和风格在不同阶段的影响,最后综合①②的比较结果,来确定合适 LoRA 权重。K-LoRA 能更加有效地融合对象和风格,在提升主体相似度指标的同时,保有较高的风格相似度,生成高质量的图片,在用户研究和 GPT 的评估中优胜。下面给出了使用K-LoRA生成的视觉结果

本篇论文完成于欧阳子恒在计算机学院媒体计算实验室学习期间,论文得到了侯淇彬副教授和李震博士的指导。论文相关代码均已开源。媒体计算实验室由程明明教授领导,主要研究方向为多模态大模型、全天候视觉感知技术以及AIGC。

计算机科学卓越班旨在培养能在关键信息技术领域推动创新和进步的领军人才,该班培养体系下的学生不仅具备深厚的专业知识和创新能力,还能将个人价值与国家发展紧密结合。同时,卓越班实施了全面的导师制度,包括学业、科研和生活导师,由学术带头人和高水平名师提供全流程指导,使学生通过参与国家级科研项目激发自身的学术兴趣和创新潜力

此外,卓越班还强调实践教学和国际化交流。通过与华为、百度等领先企业的合作,使学生有机会参与实际项目,提升实践能力。同时,卓越班通过支持学生参加国际会议和海外访学,让学生拓宽国际视野,营造国际化氛围。这一系列措施为学生提供了良好的成长环境,助力他们在未来取得更大成就。

 

论文:https://arxiv.org/abs/2502.18461

代码:https://github.com/HVision-NKU/K-LoRA

Demo:https://k-lora.github.io/K-LoRA.io/