職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
一、崗位職責
1. 大模型技術架構與體係建設
負責主流大語言模型(LLM)及多模態大模型的技術選型、架構設計與落地實施;
搭建和優化大模型訓練、微調(Fine-tuning)、推理部署的全鏈路技術環境;
設計並實現大模型的高效推理方案,包括模型量化、蒸餾、並行推理、服務化部署等優化策略;
跟蹤並引入業界前沿的大模型技術(如MoE、長上下文、多模態融合等),推動技術迭代。
2. 智能體(AI Agent)應用開發
負責智能體應用的整體架構設計,包括規劃(Planning)、記憶(Memory)、工具調用(Tool Use)、多智能體協同(Multi-Agent)等核心模塊;
基於LangChain、LlamaIndex、AutoGen、Dify等框架,獨立開發和落地智能體應用;
設計並實現Agent與外部係統(API、數據庫、知識庫、業務係統)的高效集成方案;
探索並落地Agent在自動化辦公、智能客服、代碼生成、數據分析等場景的應用。
3. 大模型應用工程化落地
負責RAG(檢索增強生成)係統的架構設計與優化,包括向量數據庫選型、Embedding模型優化、召回策略設計等;
構建大模型應用的標準化開發流程、模型評估體係及監控運維方案;
解決大模型在落地過程中的性能、穩定性、安全性及合規性問題。
4. 技術攻關與團隊協作
獨立或帶領團隊攻克大模型訓練、推理及應用中的關鍵技術難題;
輸出技術文檔、***實踐,推動團隊技術能力提升;
與產品、業務團隊緊密協作,將技術能力轉化為實際業務價值。
二、任職資格
1. 學曆與經驗要求
計算機科學、人工智能、軟件工程、數學等相關專業,本科及以上學曆(碩士/博士優先);
3年以上人工智能相關研發經驗,有完整的大模型項目落地經驗;
有大模型訓練、微調或智能體應用的實際上線項目經驗者優先。
2. 核心技術能力
編程基礎:精通Python,熟悉C 或Go者優先;具備良好的代碼規範和工程化能力;
深度學習框架:熟練掌握PyTorch、TensorFlow、DeepSpeed、Megatron-LM、vLLM等至少兩種;
大模型技術:
深入理解Transformer、GPT、LLaMA、Qwen、DeepSeek等主流大模型架構及原理;
具備大模型預訓練、SFT、RLHF/DPO/GRPO等微調技術的實踐經驗;
熟悉模型量化(GPTQ/AWQ/GGUF)、推理加速、分布式訓練與部署;
智能體與RAG:
熟悉LangChain、LlamaIndex、AutoGen、Dify、Coze等Agent開發框架;
深入理解RAG架構,熟悉向量數據庫(Milvus、Faiss、PgVector、Elasticsearch等)及Embedding技術;
具備Function Calling、ReAct、CoT等Agent核心範式的開發經驗;
基礎設施:熟悉Linux環境、Docker/Kubernetes、GPU集群調度(Slurm/K8s)、CUDA編程基礎;
模型評估:熟悉大模型評測方法(如MMLU、C-Eval、HumanEval等),具備模型效果調優能力。
3. 綜合素質要求
具備獨立解決複雜技術問題的能力,能夠從零搭建大模型訓練或應用環境;
對前沿技術有強烈好奇心,能快速跟進並實踐最新研究成果;
具備良好的溝通能力和團隊協作精神,能將技術語言轉化為業務語言;
有技術博客、開源項目貢獻、頂會論文(NeurIPS/ICML/ACL等)者優先。
1. 大模型技術架構與體係建設
負責主流大語言模型(LLM)及多模態大模型的技術選型、架構設計與落地實施;
搭建和優化大模型訓練、微調(Fine-tuning)、推理部署的全鏈路技術環境;
設計並實現大模型的高效推理方案,包括模型量化、蒸餾、並行推理、服務化部署等優化策略;
跟蹤並引入業界前沿的大模型技術(如MoE、長上下文、多模態融合等),推動技術迭代。
2. 智能體(AI Agent)應用開發
負責智能體應用的整體架構設計,包括規劃(Planning)、記憶(Memory)、工具調用(Tool Use)、多智能體協同(Multi-Agent)等核心模塊;
基於LangChain、LlamaIndex、AutoGen、Dify等框架,獨立開發和落地智能體應用;
設計並實現Agent與外部係統(API、數據庫、知識庫、業務係統)的高效集成方案;
探索並落地Agent在自動化辦公、智能客服、代碼生成、數據分析等場景的應用。
3. 大模型應用工程化落地
負責RAG(檢索增強生成)係統的架構設計與優化,包括向量數據庫選型、Embedding模型優化、召回策略設計等;
構建大模型應用的標準化開發流程、模型評估體係及監控運維方案;
解決大模型在落地過程中的性能、穩定性、安全性及合規性問題。
4. 技術攻關與團隊協作
獨立或帶領團隊攻克大模型訓練、推理及應用中的關鍵技術難題;
輸出技術文檔、***實踐,推動團隊技術能力提升;
與產品、業務團隊緊密協作,將技術能力轉化為實際業務價值。
二、任職資格
1. 學曆與經驗要求
計算機科學、人工智能、軟件工程、數學等相關專業,本科及以上學曆(碩士/博士優先);
3年以上人工智能相關研發經驗,有完整的大模型項目落地經驗;
有大模型訓練、微調或智能體應用的實際上線項目經驗者優先。
2. 核心技術能力
編程基礎:精通Python,熟悉C 或Go者優先;具備良好的代碼規範和工程化能力;
深度學習框架:熟練掌握PyTorch、TensorFlow、DeepSpeed、Megatron-LM、vLLM等至少兩種;
大模型技術:
深入理解Transformer、GPT、LLaMA、Qwen、DeepSeek等主流大模型架構及原理;
具備大模型預訓練、SFT、RLHF/DPO/GRPO等微調技術的實踐經驗;
熟悉模型量化(GPTQ/AWQ/GGUF)、推理加速、分布式訓練與部署;
智能體與RAG:
熟悉LangChain、LlamaIndex、AutoGen、Dify、Coze等Agent開發框架;
深入理解RAG架構,熟悉向量數據庫(Milvus、Faiss、PgVector、Elasticsearch等)及Embedding技術;
具備Function Calling、ReAct、CoT等Agent核心範式的開發經驗;
基礎設施:熟悉Linux環境、Docker/Kubernetes、GPU集群調度(Slurm/K8s)、CUDA編程基礎;
模型評估:熟悉大模型評測方法(如MMLU、C-Eval、HumanEval等),具備模型效果調優能力。
3. 綜合素質要求
具備獨立解決複雜技術問題的能力,能夠從零搭建大模型訓練或應用環境;
對前沿技術有強烈好奇心,能快速跟進並實踐最新研究成果;
具備良好的溝通能力和團隊協作精神,能將技術語言轉化為業務語言;
有技術博客、開源項目貢獻、頂會論文(NeurIPS/ICML/ACL等)者優先。
工作地點
地址:北四環東路69號華侖大廈A座1205
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。


3年以上
本科
2026-05-04 22:40:48
315人關注
注:聯係我時,請說是在福建人才網上看到的。
