工作职责:
1.负责大模型的开发、微调和效果优化,使大模型在产品中具备落地实用能力;
2.负责大模型服务部署,保证大模型产品具备场景化落地能力;
3.负责LLM、多模态等方向相关问题研究,跟进前沿技术动态。
任职资格:
1.硕士及以上学历,计算机相关专业优先,有较强的工程能力;
2.熟悉一种或多种多模态大模型相关技术,包括但不限于:预训练、微调、RLHF等,了解主流模型(Qwen/LLaVA/Llama/GPT等)的原理;
3.了解(AutoGPT/AutoGen/MetaGPT等)Agent框架,有模型剪枝、蒸馏、量化等小型化技术研发经验优先;
4.具备良好的编程能力,能够独立进行模型开发、调优等工作;
5.良好的自我驱动能力和团队沟通/协作能力,能快速推进任务的完成。