岗位职责:
1.围绕图文多模态领域,负责最新的算法及工程化方案的研发及落地。利用相关技术推进AIGC技术在多媒体内容场景的有效落地。
2. 探索最新的AIGC算法技术,包括模型架构优化、预训练和微调、知识蒸馏等技术;
3. 探索将AIGC模型应用于图像视频理解、生成、识别、检索等任务;
4. 探索将多模态大模型用于图像理解、视频理解、视觉推理等任务。
任职要求:
1. 硕士及以上学历,计算机视觉、自然语言处理、机器学习、数据挖掘、人工智能等相关专业的硕士或博士,长期实习优先;
2. 具备较好的编程能力,动手能力强,熟练使用至少一种开源深度学习框架;
3. 优秀的英文文献阅读能力,有人工智能顶会顶刊论文发表者优先,ACM竞赛获奖者优先;
4. 熟悉transformer、diffusion model等算法原理,对文图生成、可控生成等AIGC技术领域充满热情;
5.要求尽快到岗,每周到岗4-5天,至少实习三个月,长期实习优先考虑,有转正机会;
6.简历名称:姓名-学校-毕业时间-每