工作描述:
1、与投资、研究、交易、风控等部门合作,负责大模型应用的开发、优化与部署,推动AIGC技术在金融及投资业务场景中的有效落地;
2、参与设计与建设大模型及Agent系统核心架构,主导Context Engineering、RAG检索优化、Tool Calling等多模块的开发与整合;
3、深入研究并应用大模型技术,实现搜索问答、信息提炼、报告生成、智能推荐等信息生产与分发应用,保障技术带来商业价值;
4、跟踪大模型领域前沿技术发展趋势,输出调研报告,提出系统改进与技术迭代建议,探索多模态等技术在金融场景的应用;
5、致力于解决模型部署、数据适配、业务融合中的技术难题,提升系统稳定性与方案的可复用性,推动技术转化为业务价值。
职位要求:
1、熟练掌握大模型应用开发技术,包括LoRA微调、Prompt Engineering、RAG、Agent及SFT等,并能熟练使用LangChain、Dify等主流应用框架进行开发;
2、精通Python/Java至少一门语言,熟悉PyTorch、TensorFlow等AI开发工具及vLLM等推理引擎,具备大模型独立推理部署与性能优化的能力;
3、深入理解大模型优化方法,至少实践过SFT/RLHF/DPO/PPO中的一种,掌握Transform等架构原理及PageAttention等推理优化技术;
4、具备扎实的系统架构设计能力,能够独立拆解复杂业务问题,输出可落地的技术方案,以应对高并发、低延迟的金融业务场景需求;
5、拥有良好的沟通协作能力,能进行跨部门合作,对技术创新有热情,有LLM在金融或知识产权领域实际落地经验者优先。
收藏
取消收藏
已投递