職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1、AI服務開發與優化:基于開源知識庫、Agent框架進行二次開發,優化大模型應用性能及功能擴展。構建大模型服務化(MaaS),提供模型推理、微調、Prompt工程等核心能力,支持企業級業務場景接入。設計高可用、低延遲的分布式服務架構,解決模型部署、資源調度、負載均衡等工程問題;
2、開源技術二次開發:基于主流開源知識庫(如FAISS、Milvus)、Agent框架(如LangChain)、AI工具鏈進行深度定制化開發,滿足業務需求。優化開源組件的性能瓶頸,解決高并發場景下的穩定性問題;
3、算法與工程結合:針對業務場景優化模型推理性能(如量化壓縮、動態批處理),提升服務吞吐量。開發Prompt工程模板、RAG(檢索增強生成)流程,提升模型輸出質量;
4、系統架構設計:設計可擴展的云原生架構,集成Kubernetes/Docker實現自動化部署與運維,構建監控告警系統,保障服務SLA指標 。
任職資格:
1、本科及以上學歷,計算機科學、人工智能、軟件工程、數學等相關專業優先;
2、具有3年以上AI開發領域的工作經驗,熟悉AI服務架構、模型開發、優化及部署等相關工作內容;
3、編程能力:熟悉Python編程,有深度學習和NLP模型開發經驗;熟練掌握TensorFlow、PyTorch等深度學習框架,并有實際應用經驗;
4、算法能力:熟練掌握Transformer/BERT/GPT等模型原理,熟悉模型部署與推理框架(如vllm、sglang等),有模型微調經驗(LoRA微調、指令微調等),熟悉常見機器學習算法(如聚類/分類/強化學習);
5、系統能力:熟悉分布式系統設計,精通gRPC/RESTful API開發 部署;
6、項目經驗:2年以上大模型相關開發經驗,主導過至少2個完整AI服務落地項目;
7、軟性要求:具備強烈的技術好奇心,能快速學習新興技術,優秀的邏輯思維能力和技術問題拆解能力,適應敏捷開發流程,具備良好的跨團隊協作意識。具備良好的英語讀寫能力,能夠閱讀并理解英文技術文檔。
工作地點
地址:深圳南山區深圳-南山區TCL科學園國際E城G2 棟AB座501
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。

深圳
應屆畢業生
本科
最近更新
499人關注
注:聯系我時,請說是在江蘇人才網上看到的。
