崗位職責(zé)
1. 參與AI模型服務(wù)平臺(tái)的核心設(shè)計(jì)與開發(fā),如模型推理服務(wù)平臺(tái)核心能力搭建及各類管理功能;
2. 參與平臺(tái)管理后臺(tái)及相關(guān)配置界面開發(fā),實(shí)現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性;
3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項(xiàng)目,評(píng)估技術(shù)可行性,快速集成適配平臺(tái)的輕量化技術(shù)方案;
4. 基于Docker/K3s環(huán)境,編寫自動(dòng)化腳本,完成裸金屬服務(wù)器的環(huán)境檢測(cè)系統(tǒng)初始化及模型運(yùn)行環(huán)境的標(biāo)準(zhǔn)化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗(yàn),能獨(dú)立完成后端模塊開發(fā)API設(shè)計(jì)與調(diào)試,具備良好的系統(tǒng)設(shè)計(jì)與邏輯抽象能力;
2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗(yàn);
3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先;具備良好的工程習(xí)慣,能獨(dú)立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫;
4. 具備較強(qiáng)的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。
加分項(xiàng)
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項(xiàng)目;具備GPU服務(wù)器運(yùn)維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗(yàn);
2. 參與過平臺(tái)型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),有相關(guān)架構(gòu)設(shè)計(jì)或核心模塊開發(fā)經(jīng)驗(yàn);
3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨(dú)立完成簡(jiǎn)單前端頁面開發(fā);
5. 熟悉Linux系統(tǒng)運(yùn)維,,掌握Linux自定義鏡像封裝(適配GPU及模型運(yùn)行場(chǎng)景)。
職位類別:
舉報(bào)