工作职责:
1.结合现有产品及业务,负责进行大模型相关产品的算法开发工作;
2.负责大模型的开发、微调和效果优化,使大模型在产品中具备落地实用能力;
3.负责大模型的量化和服务部署,具备场景化落地能力;
4.负责LLM、多模态、AI Agent等方向相关问题研究,跟进前沿技术动态。
任职资格:
1.硕士及以上学历,计算机相关专业优先,有较强的工程能力;
2.熟悉一种或多种多模态大模型相关技术,包括但不限于:预训练、微调、RLHF等,了解主流模型(Qwen/LLaVA/Llama/GPT等)的原理并有自己的理解;
3.了解(AutoGPT/AutoGen/MetaGPT等)Agent框架,有模型剪枝、蒸馏、量化等小型化技术研发经验优先;
4.具备良好的编程能力;
5.良好的自我驱动能力和团队沟通/协作能力,能快速推进任务的完成。