職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
職位概述
我們在招聘算法架構工程師,麵向網約車核心算法與大模型業務,負責大模型訓練與推理性能優化、線上推理服務與自動化更新架構建設,並持續提升網約車算法服務的基礎性能與穩定性,支撐核心業務規模化增長與高可用運行。
工作職責
1. 大模型訓練/推理性能優化
● 負責大模型訓練與推理鏈路的性能優化:吞吐、時延、顯存占用與成本優化。
● 推進並落地訓練/推理加速方案(並行訓練、混合精度、編譯/算子優化、KV Cache、批處理/動態batch等),提升整體效率與穩定性。
2. 自動化更新與線上推理服務架構
● 負責線上推理服務的係統架構設計與落地:服務化、彈性伸縮、灰度發布、回滾、限流熔斷、監控告警等。
● 建設模型自動化更新能力:模型版本管理、自動化評測/準入、發布流水線與可觀測性,保障模型迭代效率與線上風險可控。
3. 網約車算法服務基礎性能優化
● 麵向網約車核心算法服務(定價/分單/供需預測等)進行基礎性能優化:延遲、吞吐、穩定性與資源成本。
● 聯合算法與工程團隊優化數據鏈路、特征/召回/打分等關鍵路徑,提升服務SLA與線上效果穩定性。
任職要求
● 計算機相關背景,具備紮實的係統工程能力與性能優化經驗(C /Go/Java 任一熟悉,Python 熟悉加分)。
● 有模型訓練或推理係統經驗,理解GPU/CPU算力、內存/顯存、網絡與存儲等性能瓶頸定位方法。
● 熟悉在線服務基礎設施與工程體係:服務治理、容器化/集群資源管理(如K8s)、CI/CD、監控可觀測性等。
● 良好的跨團隊協作能力,能與算法、平台、業務團隊高效推動落地。
加分項
● 有大模型推理框架/加速經驗(如TensorRT/ONNX Runtime/vLLM/Triton等任一方向)或分布式訓練經驗。
● 有高並發低延遲在線係統性能治理經驗(Profiling、壓測、容量規劃、故障演練等)。
● 有模型發布與MLOps體係建設經驗(評測準入、自動化發布、灰度與回滾、模型可觀測性)。
工作地點
地址:杭州濱浦路與東冠路交叉口東北方
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
戴HR
杭州優行科技有限公司
-
請選擇
-
公司規模未知
-
公司性質未知
-
杭州市濱江區江陵路1760號1號樓602室

杭州
應屆畢業生
本科
2026-04-09 04:04:29
241人關注
注:聯係我時,請說是在福建人才網上看到的。
