

编者按

今日白露,
回望这个暑假,除了休整身心外,还有不少深小理或跟着导师泡在实验室里做实验,或进行社会实践、调研产业发展,或走进国际名校开展交流……着实过了一个“高能量”假期。
今天,《深小理的高能量暑假》开栏,首期带大家一起来了解2024级本科生杨晓东和他的团队成员在这个暑假,如何通过泡实验室把兴趣爱好变成看得见的成绩,并获得国赛二等奖。

杨晓东
这个夏天,我和团队一起带着“AI
最初萌生做这个项目的想法其实很简单:我和队友都是动漫迷,想尝试使用文生图模型来生成连环
上半年备赛广东省赛时,我们首先着手筛选开发平台,最终选定了容易上手且开源的ComfyUI和Dify,来搭建交互式
问题很快出现,如何让文生视频技术落地成有差异化的应用?当时主流的文生视频模型稳定生成视频时长在5到10秒左右,这么短的时长能做什么?因此,延长视频有效时长成了我们的首要目标。
可行方案虽多,但受限于项目经费,像“实时文生视频生成“这种相对高成本的方法无法落地。“既然实时生成不行,能不能提前缓存
而真正决定比赛胜负的关键正是控制模型的训练和部署。现在回头看,省级比赛更看重创新思路,对演示效果和模型成熟度的要求相对宽松。也正因 “动漫人物动作控制” 的想法足够新颖,我们才获得了晋级国赛的资格。但进入国赛后,我和队友达成了共识:必须把这个 “实验室阶段的雏形

初代虚拟桌宠,没有对话窗口,控制台全是调试信息
于是我们重启了Dify平台,同时恶补Python的UI 编排和Web开发知识,全力推进

国赛虚拟桌宠,ui优化,接入大语言模型,画面和动作更加连贯
举办国赛的城市长春,给我的第一印象就是热情。一路上,操着爽朗东北话的
在决赛答辩那天,我本来特别紧张,没想到有一位图像生成领域的专家评委并没有提出刁钻问题,反而从专业角度为项目提供了优化方向与建议,这份来自行业前辈的包容与鼓励,让我既意外又感动。
答辩结束后,我和队友抽了半天时间去看长白山天池,站在山顶,晴空万里。颁奖之际,当听到 “全国二等奖” 的获奖名单念到我们项目时,脑海里瞬间闪过整个暑假的画面:宿舍里彻夜不熄的灯光、反复调试却失败的代码、陪伴我们熬夜的咖啡…… 那些熬到凌晨的日子,终于有了最圆满的答案。
我们的指导老师、计算机科学与控制工程学院助理教授韩瑞泽总说:“兴趣是最大的动力。” 其实这个暑假我更明白,光有兴趣不够,还要有啃硬骨头的坚持。从一开始只会跟着论文复现代码,到如今能自主设计模型架构、标注样本,我不仅摸清了项目开发的全流程,更学会了从容应对问题——预算不够就换思路,模型不行就反复
比赛结束了,但 “AI
为了攻克这个难题,我在B站查阅资料、学习相关课程,系统了解了人体关键点Pose模型的训练方法,随后着手准备动漫人体关键点

人体关键点检测结果和概率分布热力图
为了进一步优化模型精度,我亲手标注了75张动漫人物样本关键点,按6:1划分训练集和验证集,盯着模型训练了100轮。当训练到第80轮时,模型
虚拟数字产业与
这个夏天,完结撒花。
各位深小理们
你的暑假又是怎样度过的呢?
欢迎跟我们分享~
投稿邮箱:
wangzhikang@suat-sz.edu.cn
截止日期:
2025年9月21日18:00

来源:党委组织宣传部
文字:杨晓东
责编:王璐
审校:李韵、张吟越、王之康

为SUAT点个赞和在看吧
高招云直播