職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
該職位需要融合 DevOps 專業知識和后端開發技能,要求在動態的初創公司環境中,能夠在基礎設施穩定性與開發速度之間進行有效的優先級排序。
● CI/CD Pipeline管理: 設計、實施、管理并持續優化用于后端服務以及可能支持機器學習模型的自動化 CI/CD 流水線。專注于通過自動化進行測試、集成和部署,以最大限度地減少手動干預并加速交付周期。
● 云基礎設施管理: 配置、管理、自動化和保護我們的云基礎設施,確保高可用性、可擴展性、可靠性和成本效益。您將負責支撐我們 AI 應用的系統的運營健康。
● 基礎設施即代碼 (IaC): 倡導并使用 Terraform 等工具實施 IaC 原則來管理基礎設施配置,實現一致、可重復且版本受控的部署。
● 容器化與編排: 使用 Docker 構建、部署和管理容器化應用程序。設置和維護 Kubernetes 集群以大規模編排服務。
● 監控、日志記錄與警報: 建立并維護全面的監控、日志記錄和警報系統(例如,使用 Prometheus、Grafana、ELK Stack、CloudWatch),以主動識別和解決問題,確保后端系統和支持性 ML 基礎設施監控的最佳性能和可靠性。
● 后端開發: 使用 Python、Go、Node.js 參與后端 API 和微服務的開發、測試、部署和維護。構建構成我們平臺骨干的健壯、可擴展且安全的服務。
● ML 基礎設施支持(基礎 MLOps): 與我們的機器學習工程師緊密合作,構建和維護機器學習生命周期所需的基礎設施。這包括支持數據管道、促進模型部署以及確保 ML 系統的運行穩定性,為我們規模擴大后可能設立的更專業的 MLOps 職能奠定基礎。
● 安全與合規: 在所有基礎設施和應用程序中實施并強制執行安全最佳實踐。確保系統遵守相關的合規標準。
● 協作與溝通: 在小型的分布式團隊中有效工作,與其他成員緊密協作。在遠程工作環境中保持清晰和主動的溝通。
必備資格:
● 技術技能:
○ 3-5 年以上 DevOps、基礎設施工程、SRE 或后端軟件工程相關職位的專業經驗。
○ 在主流云平臺上管理生產工作負載的成熟實踐經驗。
○ 豐富的“基礎設施即代碼”經驗,特別是 Terraform。
○ 精通容器化(Docker)和容器編排(Kubernetes)。
○ 設計、構建和管理 CI/CD 流水線(例如 GitHub Actions、GitLab CI、Jenkins)的實踐經驗。
○ 扎實的后端編程語言技能,至少掌握 Python、Go 或 Node.js 中的一種。
○ 開發和維護 RESTful API 的經驗。
○ 具備關系型數據庫(如 PostgreSQL、MySQL)和 NoSQL 數據庫(如 MongoDB、Redis)的使用經驗。
○ 精通用于自動化的腳本語言(例如 Bash、Python)。
○ 具備實施和使用監控及日志記錄工具(例如 Prometheus、Grafana、ELK Stack)的經驗。
○ 精通 Git 版本控制。
○ 強大的分析和故障排除能力,以及主動解決問題的方法。
● 關于您 / 心態:
○ 您對自己所做的事情以及為我們的使命做出貢獻充滿熱情。
○ 您通過尋求專業和個人的高速成長來追求卓越。
○ 您能跟上極快的節奏,并在動態環境中茁壯成長(以周為單位思考,而非季度)。
○ 面對模糊性和復雜性,您具有韌性和足智多謀,并且樂于(而非忍受)變化。
○ 您能帶來批判性思維,并敢于表達自己的觀點。
○ 您能將 AI 工具(如 GitHub Copilot、ChatGPT、Cursor 等)作為基礎工作流程的一部分進行反射性使用,以加速開發、原型設計和交付。
○ 您能建設性地擁抱差異和分歧,以達成目標并向前邁進。
○ 您擅長在遠程環境中以數字優先的方式工作。
○ 優秀的英語溝通能力(書面和口頭),對于遠程協作至關重要。
優先資格:
● 有 MLOps 工具和平臺(例如 MLflow、Kubeflow、DVC)的使用經驗。
● 具備 Python、Go、Node.js 特定后端框架的經驗。
● 熟悉消息隊列系統(例如 Kafka、RabbitMQ)或數據流技術。
● 有無服務器技術(例如 AWS Lambda、Google Cloud Functions)的經驗。
● 曾在早期初創公司環境中有效工作的經驗。
● 直接為 AI/ML 工作負載或團隊提供基礎設施支持的經驗。
工作地點
地址:北京朝陽區北京市-朝陽區-姚家園北路


職位發布者
劉爽HR
蘇州英格瑪服務外包股份有限公司

-
中介服務
-
51-99人
-
私營·民營企業
-
營輝路