工作职责:
1、负责大模型的开发、微调和效果优化,使大模型的行业化能力具备核心竞争优势;
2、负责大模型的量化和服务部署,具备场景化落地经验和技术沉淀能力;
3、负责LLM、多模态、AI Agent等方向相关问题研究,跟进前沿技术动态。
任职资格:
1、硕士及以上学历,计算机相关专业优先,有较强的工程能力;
2、熟悉一种或多种多模态大模型相关技术,包括但不限于:预训练、微调、RLHF等,了解主流模型(Qwen/LLaVA/Llama/GPT等)的原理并有自己的理解;
3、了解(AutoGPT/AutoGen/MetaGPT等)Agent框架,有模型剪枝、蒸馏、量化等小型化技术研发经验优先;
4、良好的自我驱动能力和团队沟通/协作能力,能快速推进任务的完成。