Position: Senior Machine Learning Engineer (full-time)
Формат: Удаленный
Мы в zehn.ai (zehnlab.ai) разрабатываем технологии генерации синтетических данных, которые помогают решать задачи нехватки данных и обеспечивают конфиденциальность в таких сферах, как здравоохранение, энергетика, образование. Наши решения позволяют создавать данные, точно отражающие реальные распределения, что значительно улучшает результаты работы алгоритмов машинного обучения.
Сейчас мы ищем инженера по машинному обучению, который сможет расширить возможности генерации синтетики с помощью текущих SOTA подходов.
Обязанности:
- Адаптация существующих алгоритмов генерации синтетических данных для работы с текстом.
- Оптимизация обработки текстовых данных, включая работу с редкими случаями (outliers).
- Интеграция текстовых данных в мультимодальные архитектуры.
- Внедрение современных подходов в NLP и генеративных моделях.
- Организация процессов сбора, разметки и подготовки текстовых данных.
- Участие в развертывании моделей в продакшн.
Требования:
- Опыт работы +5 года в NLP в одной или нескольких областях:
- Анализ тональности (Sentiment Analysis),
- Машинный перевод (Machine Translation),
- Генерация текста (Text Summarization),
- Чат-боты и виртуальные ассистенты,
- Мультимодальные модели (Multimodal Models).
- Отличное знание архитектур нейронных сетей (BERT, GPT, трансформеры).
- Уверенное владение PyTorch, Docker, CUDA.
- Опыт работы с текстовыми данными, включая сложные или редкие случаи.