職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
職責描述:
1.模型優化與壓縮
a)剪枝、量化與壓縮:采用剪枝、量化和模型壓縮技術,降低模型尺寸和計算複雜度,滿足端側設備的資源限製。
b)模型蒸餾與輕量化設計:利用模型蒸餾等技術構建輕量級模型,保證在減少資源占用的同時維持較高的推理精度。
2.軟件架構設計
a)輕量級架構構建:設計專為端側設備優化的模型架構,確保在有限計算資源下依然能夠高效運行。
b)模塊化設計:構建靈活、易於擴展的架構,便於後續更新和功能擴展。
3.平台適配與部署
a)跨平台適配:針對不同硬件平台(如高通平台、英偉達平台等),進行模型適配和優化,確保在多種設備上均能穩定部署。
b)部署流程製定:建立標準化的部署流程,包括環境配置、依賴管理和版本控製,確保部署高效且一致。
4.推理性能優化
a)硬件加速利用:結合GPU、NPU或DSP等硬件加速技術,優化模型的推理速度,滿足實時性需求。
b)並行計算與異步處理:設計高效的並行處理方案,減少延遲,提升整體推理性能。
5.資源與能耗管理
a)內存與功耗平衡:通過優化計算圖和算法,合理分配設備內存和處理資源,降低能耗,延長設備續航。
b)實時監控與調優:建立監控機製,實時追蹤模型在端側設備上的資源使用情況,及時調整優化策略。
6.性能評估與反饋
a)指標監測:製定並監控關鍵性能指標(如響應時間、吞吐量、能耗等),確保模型部署後的性能符合預期。
b)持續迭代優化:基於性能數據和用戶反饋,不斷進行迭代優化,完善模型在不同硬件環境下的表現。
7.跨團隊協作
a)整合研發與產品需求:與研發和產品團隊合作,根據業務需求調整部署策略,確保端側方案能夠有效落地並滿足實際應用場景。
任職要求:
1. 計算機科學、人工智能、數學等相關專業本科及以上學曆。
2. 1年以上相關工作經驗,有大規模預訓練模型、微調、端側部署、提示工程及RAG經驗者優先。
3. 熟練掌握深度學習框架(如TensorFlow、PyTorch等),並有實際的模型訓練與優化經驗。
4. 熟悉自然語言處理、計算機視覺等領域的模型微調和應用技術。
5. 熟悉端側設備(如嵌入式係統、移動設備等)上的模型部署與優化技術,了解模型量化、剪枝等優化方法。
6. 熟悉提示工程的設計與實現,能夠通過提示優化模型的生成效果。
7. 熟悉RAG(檢索增強生成)技術,並有實際應用經驗,能夠將外部知識和生成模型有效結合。
8. 能夠獨立完成大規模數據集的處理、清洗、標注和分析工作。
9. 良好的編程能力,熟練使用Python,具有C 等其他語言能力者優先。
10. 良好的團隊協作精神,溝通能力強,能承受工作壓力。
工作地點
地址:龍東大道3999號
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
招聘配置..HR
上汽通用汽車有限公司
-
汽車·摩托車
-
1000人以上
-
中外合資(合資·合作)
-
上海浦東新區申江路1500號


應屆畢業生
本科
2026-04-07 19:18:24
1030人關注
注:聯係我時,請說是在福建人才網上看到的。
