Специалисты

Описание

Образование: 2025 НИУ ИТМО, Санкт-Петербург Искусственный интеллект
2022 Karpov coursers StartML, Machine Learning, 2022 Data Camp Data scientist with python, Data Scientist with python, 2021 НИУ ВШЭ Физика, Физика конденсированного состояния вещества.

Владение языками программирования: Python
Технологии и основные скилы: SQL, Python, NumPy, pandas, Matplotlib, Seaborn, Power BI, Bash, Docker, Kubernetes, PyTorch, XGBoost, CatBoost, TensorFlow, Airflow, Hadoop, Machine Learning, PostgreSQL, Redis, FastAPI, Компьютерное зрение, NLP, MLflow, DVC, A/B тестирование, Deep Learning, Data Science, ML, Scikit-learn, Нейронные сети
?

Опыт
Проект

платформа на основе LLM для автоматизации клиентского сервиса, анализа рынка и поддержки принятия решений в финансовой сфере

Описание

Роль в проекте: ML Engineer Достижения: Разработаны системы поддержки клиентов на основе LLM с использованием агентов LLM, обеспечивающие автоматизированное, похожее на человеческое взаимодействие и повышающие эффективность обслуживания клиентов. Создан финансовый чат-бот, использующий агентов LLM и фреймворки: LangChain, LlamaIndex, BERT, GPT и vLLM. Интегрированная генерация поиска и дополнений (RAG) для повышения точности ответов и релевантности финансовых запросов. Разработан и внедрен сервис анализа настроений для новостей на финансовых рынках, использующий тонко настроенные LLM для предоставления действенных идей для торговых стратегий и принятия решений. Тонко настроенные LLM для агентов принятия решений с подкреплением (RL), позволяющие принимать адаптивные и учитывающие контекст решения в динамических финансовых средах. Разработан и внедрен внутренний сервис ELT для мониторинга новостей в реальном времени из основных СМИ, что позволяет заинтересованным сторонам своевременно получать информацию о рынке и принимать решения на основе данных. Оптимизированный вывод LLM с использованием таких методов, как квантование, дистилляция и фреймворки ускорения (например, vLLM, NVIDIA TensorRT), что позволяет достичь производительности в реальном времени для приложений производственного уровня.

Технологии

LLM, LangChain, LlamaIndex, BERT, GPT, vLLM, RAG (Retrieval-Augmented Generation), NLP, Reinforcement Learning (RL), ELT-процессы, PostgreSQL / MySQL (хранилище данных), Redis (кеширование), FastAPI / REST API, Docker, Kubernetes, NVIDIA TensorRT, Hugging Face Transformers, Python, Pandas, NumPy, PyTorch, TensorFlow, Scikit-learn, Kafka / RabbitMQ (для потоковой передачи новостей), Astra DB / Pinecone / FAISS (векторные БД для RAG), News API / RSS (источники новостей), MLflow / DVC (управление ML-экспериментами и данными), Jira / Confluence (управление задачами)

Длительность

Август 2023- Апрель 2025 месяцев

Проект

платформа на основе LLM и VLM для автоматизации клиентского сервиса, анализа новостей и обработки документов в финансовой сфере

Описание

Роль в проекте: ML Engineer Достижения: Разработаны и внедрены диалоговые системы на основе Large Language Model (LLM) для поддержки клиентов и интерактивных приложений, использующие современные архитектуры, такие как GPT, T5 и BERT, для обеспечения подобного человеческому разговорному опыту. Интегрированы передовые ускоряющие фреймворки, такие как NVIDIA TensorRT, ONNX Runtime и оптимизации transformers Hugging Face для достижения скорости инференса в реальном времени, что позволяет масштабировать развертывание диалоговых систем. Создан и оптимизирован пайплайн OCR, использующий Vision-Language Models (VLM), включая InterVL2, и точно настроенные модели VLM для повышения точности и эффективности извлечения данных, сокращения ручных усилий и эксплуатационных расходов Использованы методы квантования после обучения (PTQ) и обучения с учетом квантования (QAT) для оптимизации моделей для развертывания в средах с ограниченными ресурсами. Разработана система классификации новостей на основе LLM с recall 0,97, автоматизирующая категоризацию новостных статей по бизнес-доменам и значительно повышающая скорость и точность анализа рынка. Улучшена эффективность развертывания модели и совместной работы команды за счет надежных практик MLOps и пайплайнов CI/CD. Тонкая настройка LLM на доменно-специфических наборах данных для улучшения контекстного понимания и релевантности ответов, что позволило на 20% улучшить показатели удовлетворенности пользователей. Обеспечены возможности разговорного ИИ в реальном времени с низкой задержкой, что повышает удовлетворенность и вовлеченность пользователей.

Технологии

LLM (GPT, T5, BERT), Vision-Language Models (InterVL2), NVIDIA TensorRT, ONNX Runtime, Hugging Face Transformers, OCR, RAG (Retrieval-Augmented Generation), PTQ / QAT (квантование моделей), PyTorch, TensorFlow, FastAPI / REST API, Docker, Kubernetes, MLflow, DVC, GitLab CI / Jenkins, PostgreSQL / Redis, LangChain, LlamaIndex, FAISS / Pinecone (векторные БД), Scikit-learn, Pandas, NumPy, Python, NLP, MLOps, OCR Pipeline, Conversational AI, vLLM (опционально)

Длительность

Февраль 2021 — Август 2023 месяца

Проект

Data-платформа для стратегического управления бизнесом

Описание

Роль в проекте: ML Engineer Достижения: Руководил проектом по созданию хранилища данных (DWH) и отчетов Power BI, позволяющих проводить аналитику данных в реальном времени и получать полезные сведения. Эта инициатива повысила эффективность принятия решений на 30% и сократила время отчетности на 50%. Реализовал стратегические консалтинговые проекты в секторах телекоммуникаций, ИТ, ИИ и промышленности, предоставляя индивидуальные решения, которые оптимизировали операции и увеличили доход на 15–20% по нескольким клиентам. Создавал прогностические модели, которые повысили точность прогнозирования на 20%. Внедрил алгоритмы кластеризации для сегментации данных клиентов, что привело к 10%-ному повышению эффективности маркетинговой кампании. Разрабатывал системы классификации, которые автоматизировали ручные процессы, экономя более 200 часов в год.

Технологии

Power BI, SQL, PostgreSQL / MS SQL / Oracle, Python (Pandas, Scikit-learn), R (опционально), DWH (Data Warehouse), ETL/ELT процессы, Tableau (опционально), машинное обучение (прогностические модели кластеризация, классификация,), алгоритмы ML (Random Forest, XGBoost, K-means и др.), MLOps (по необходимости), Git, Excel.

Длительность

Январь 2019 — Февраль 2021 месяц