ДЕНИС СУДАКОВ[ru/en]
Разработка инфраструктуры для AI-агентов, пост-обучения языковых моделей
и локальных AI-систем.
Москва, Россия
Email · GitHub · CV
~~~
ОБО МНЕ
Я занимаюсь разработкой практичных AI-систем, с фокусом на инфраструктуру
для агентов и пайплайны пост-обучения моделей.
Основная часть моей работы — это надёжные, композиционные системы для AI-агентов
и локальная агентная инфраструктура. Я считаю, что в текущей экосистеме не хватает
базовых инструментов для создания полезных, расширяемых агентов, которые легко
делить, модифицировать и интегрировать. Моя цель — проектировать и реализовывать
эти недостающие примитивы в виде открытых систем.
В настоящее время учусь на геологическом факультете МГУ имени М.В. Ломоносова,
но большую часть времени посвящаю AI-системам и исследованиям в области ML.
~~~
ПРОЕКТЫ
- su-agent (WIP)
Локальный runtime и backend для запуска расширяемых AI-агентов на машине пользователя.
Предоставляет системное API для клиентских приложений, пакеты навыков/инструментов,
управление сессиями и памятью. Построен вокруг модульности и локального исполнения.
- su-memory (WIP)
Расширение для su-agent (совместимо с Pi coding agent).
Файловая персистентная память и система «инкубации навыков».
Без векторных поисков, embeddings или RAG — только файлы.
- su-subagent (WIP)
Расширение для su-agent (совместимо с Pi coding agent).
Минимальное делегирование задач через отдельные процессы агентов.
Без общего контекста, без вложенных диалогов, без фреймворков.
- su-ASR
OpenAI-совместимый сервер распознавания речи. Потоковая обработка, поддержка
множества языков, низкая задержка.
- Madiz
Система радиационного мониторинга на стратосферной спутниковой платформе
(RPi 4 + кастомные сенсоры). Работа с аппаратной частью, обработка данных,
сжатие и логика управления.
Ранние проекты
- su-code
Мультиплексор coding-агентов поверх su-agent, интерфейс в стиле Codex.
Изначально форк t3-code.
- su-claw
Персональный расширяемый агент с системой памяти и управления навыками.
Вдохновлён Hermes-архитектурами агентов.
Исследования
- GSPO-PyTorch
Реализация Group Sequence Policy Optimization — RL-алгоритма для языковых
моделей, решающего ограничения GRPO через importance sampling
на уровне последовательностей.
- aiijc-701w
RL fine-tuning моделей Qwen для математического рассуждения. Построение датасетов,
бенчмаркинг, пайплайны GRPO-обучения.
~~~
ПУБЛИКАЦИИ
- Скоро — заметки об исследованиях и системном дизайне
~~~
ИНТЕРЕСЫ
- Пост-обучение LLM для агентных систем
- Локальная AI-инфраструктура
- Инструменты для AI-разработчиков
~~~
ПРЕПОДАВАНИЕ
- Преподаватель, Международная летняя школа
Гимназия МГУ (2026)
Обучение школьников AI, машинному обучению и современным агентным системам.
~~~
ОБРАЗОВАНИЕ
- МГУ им. М.В. Ломоносова
Бакалавриат, геология (2025–2029)
Самообразование
- Stanford CS336 — Language Modeling from Scratch
- Stanford CS229 — Machine Learning
- Stanford CS230 — Deep Learning
- Harvard CS50AI
- Harvard CS50
- Harvard CS50 Web