Денис Судаков

ДЕНИС СУДАКОВ[ru/en]

Разработка инфраструктуры для AI-агентов, пост-обучения языковых моделей
и локальных AI-систем.
Москва, Россия

Email · GitHub · CV

~~~

ОБО МНЕ

Я занимаюсь разработкой практичных AI-систем, с фокусом на инфраструктуру
для агентов и пайплайны пост-обучения моделей.

Основная часть моей работы — это надёжные, композиционные системы для AI-агентов
и локальная агентная инфраструктура. Я считаю, что в текущей экосистеме не хватает
базовых инструментов для создания полезных, расширяемых агентов, которые легко
делить, модифицировать и интегрировать. Моя цель — проектировать и реализовывать
эти недостающие примитивы в виде открытых систем.

В настоящее время учусь на геологическом факультете МГУ имени М.В. Ломоносова,
но большую часть времени посвящаю AI-системам и исследованиям в области ML.

~~~

ПРОЕКТЫ

 - su-agent (WIP)
   Локальный runtime и backend для запуска расширяемых AI-агентов на машине пользователя.
   Предоставляет системное API для клиентских приложений, пакеты навыков/инструментов,
   управление сессиями и памятью. Построен вокруг модульности и локального исполнения.

 - su-memory (WIP)
   Расширение для su-agent (совместимо с Pi coding agent).
   Файловая персистентная память и система «инкубации навыков».
   Без векторных поисков, embeddings или RAG — только файлы.

 - su-subagent (WIP)
   Расширение для su-agent (совместимо с Pi coding agent).
   Минимальное делегирование задач через отдельные процессы агентов.
   Без общего контекста, без вложенных диалогов, без фреймворков.

 - su-ASR
   OpenAI-совместимый сервер распознавания речи. Потоковая обработка, поддержка
   множества языков, низкая задержка.

 - Madiz
   Система радиационного мониторинга на стратосферной спутниковой платформе
   (RPi 4 + кастомные сенсоры). Работа с аппаратной частью, обработка данных,
   сжатие и логика управления.

Ранние проекты

 - su-code
   Мультиплексор coding-агентов поверх su-agent, интерфейс в стиле Codex.
   Изначально форк t3-code.

 - su-claw
   Персональный расширяемый агент с системой памяти и управления навыками.
   Вдохновлён Hermes-архитектурами агентов.

Исследования

 - GSPO-PyTorch
   Реализация Group Sequence Policy Optimization — RL-алгоритма для языковых
   моделей, решающего ограничения GRPO через importance sampling
   на уровне последовательностей.

 - aiijc-701w
   RL fine-tuning моделей Qwen для математического рассуждения. Построение датасетов,
   бенчмаркинг, пайплайны GRPO-обучения.

~~~

ПУБЛИКАЦИИ

 - Скоро — заметки об исследованиях и системном дизайне

~~~

ИНТЕРЕСЫ

 - Пост-обучение LLM для агентных систем
 - Локальная AI-инфраструктура
 - Инструменты для AI-разработчиков

~~~

ПРЕПОДАВАНИЕ

 - Преподаватель, Международная летняя школа
   Гимназия МГУ (2026)
   Обучение школьников AI, машинному обучению и современным агентным системам.

~~~

ОБРАЗОВАНИЕ

 - МГУ им. М.В. Ломоносова
   Бакалавриат, геология (2025–2029)

Самообразование

 - Stanford CS336 — Language Modeling from Scratch
 - Stanford CS229 — Machine Learning
 - Stanford CS230 — Deep Learning
 - Harvard CS50AI
 - Harvard CS50
 - Harvard CS50 Web