Специалисты
Технологии
Clickhouse / Elasticsearch / Nexus / Helm / Linux / Redis / Kafka (Apache Kafka) / Python / MLflow / DVC / Prometheus / Grafana / Ansible / AWS / SQL / Hadoop / Docker / PySpark / Terraform / Kubernetes
Workflow
DevOps / Jenkins / ELK / GitLab / ArgoCD / Apache Airflow (Airflow) / CI/CD
Профессиональные навыки и умения:
Деплой моделей/приложений
Администрирование кластеров
Настройка ci/cd,
Настройка мониторингов /логирования
Ускорение процессов
Повышение точности
Образование
Высшее образование
2013 Государственный университет управления, Москва
Высшая школа бизнеса ГУУ, Аналитик-финансовый менеджер
Дополнительное образование/сертификаты:
Advanced MLops
PyMagic, MLops engineer
2024
Промышленный ML
PyMagic, MLops engineer
2023
Start ML
Karpov Curses, ML engineer
2021
Backend developer
GeekUniversity, Backend developer
2020
Рекомендательная система и бэкенд крупного ритейлера
Роль в проекте DevOps Engineer Команда проекта 7 Обязанности на проекте и личные результаты Развернул и поддерживал инфраструктуру для веб-приложений в AWS, Yandex Cloud. Автоматизировал CI/CD-процессы с использованием GitLab CI, ArgoCD. Управлял кластерами Kubernetes Внедрил подходы управления инфраструктуры как код (IaC) с Terraform, Ansible. Внедрил централизованное логирование (ELK) и мониторинг (Prometheus + Grafana).
Kubernetes, Terraform, Ansible, GitLab CI, ArgoCD, Docker, ELK, Prometheus, Grafana, AWS, Yandex Cloud
июль 2024 - по настоящее время месяцев
ML платформа, в рамках которой было развернуто несколько моделей машинного обучения.
MLops инженер/ DevOps-инженер Чем занимался на проекте: Развертывание и управление инфраструктурой: Развернул гибкую, масштабируемую ML-платформу в Kubernetes, автоматизировав управление ресурсами с Terraform. Настроил автоматизированное создание окружений для экспериментов и продакшн-развертываний (Helm). Обеспечил отказоустойчивость и балансировку нагрузки для ML-сервисов с Istio, Nginx Ingress. CI/CD и управление ML-пайплайнами: Внедрил автоматические CI/CD пайплайны для обучения, тестирования и деплоя моделей (GitLab CI, ArgoCD, MLflow), что снизило время выхода моделей в прод. Настроил автоматизированное версионирование и контроль данных с DVC, MLflow, MinIO (S3). Организовал развертывание ML-моделей в Kubernetes с использованием FastAPI, Seldon Core. Мониторинг и логирование моделей: Разработал систему мониторинга ML-моделей и инфраструктуры на базе Prometheus, Grafana, ELK. Внедрил трекинг метрик и алерты при ухудшении качества модели. Настроил логирование событий ML-инференса что упростило аудит и трассировку запросов. Управление ресурсами и обработка данных: Автоматизировал выделение CPU/RAM-ресурсов через Kubernetes. Оптимизировал обработку больших данных с Apache Spark, Kafka, AirFlow, ускорив предобработку данных на 30%. Разработка моделей (ML Risk Analytics): Разработал и внедрил ML-модель андеррайтинга и риск-анализа, что сократило время обработки заявок на 40% и повысило точность прогнозов. Оптимизировал процесс ценообразования через ML-модель прогнозирования премий, что увеличило доходность страховых полисов на 15%. Настроил A/B тестирование моделей и автоматическую переобучаемость.
Kubernetes, Terraform, Seldon Core, MLflow, DVC, Airflow, GitLab CI, Python, ClickHouse, Prometheus, Grafana, ELK
ноябрь 2018 - март 2024 месяцев