Разборы задач

Проектирование LeetCode

Средний

Попробуйте решить эту задачу самостоятельно

Практикуйтесь с интерактивными подсказками и моментальной обратной связью

Постановка задачи

🧑‍💻 Что такое LeetCode?

Вероятно, LeetCode в представлении не нуждается. Скорее всего, вы уже проводите там пару часов каждый день, готовясь к интервью. Но для тех, кто не в курсе: LeetCode - это платформа, которая помогает инженерам готовиться к алгоритмическим интервью. На ней есть огромная коллекция задач разной сложности, а также возможность отправлять решения и получать обратную связь. Кроме того, LeetCode регулярно проводит соревнования по программированию.

Функциональные требования

Основные требования

Пользователи могут видеть список задач.
Пользователи могут просматривать задачу и писать решение на нескольких языках.
Пользователи могут отправлять свое решение и получать результат прогона по тест‑кейсам.
Пользователи могут просматривать таблицу лидеров соревнований в реальном времени.

За рамками задачи:

Аутентификация пользователей
Профили пользователей
Платежи
Аналитика пользователей

В рамках этой задачи (как и большинства задач по System Design) считаем, что пользователь уже аутентифицирован, а его ID хранится в сессии или auth-токене.

Нефункциональные требования

Основные требования

Система должна быть ориентирована на доступность (availability > consistency).
Система должна обеспечивать изоляцию и безопасность при запуске кода пользователей.
Результаты решений пользователей должны возвращаться в течение 5 секунд.
Система должна масштабироваться, чтобы выдерживать нагрузку от соревнований с 100 000 участников.

За рамками задачи:

Система должна быть отказоустойчивой.
Система должна обеспечивать безопасные транзакции покупок.

Описание требований за рамками задачи показывает продуктовое мышление и дает интервьюеру возможность переопределить приоритеты. Но это все же необязательная вещь, если дополнительные идеи не приходят в голову сразу, не тратьте время и двигайтесь дальше.

Важно отметить, что у LeetCode всего единицы миллионов пользователей и около 4000 задач. По меркам большинства System Design интервью это небольшой масштаб и это сильно влияет на дизайн.

Вот как это могло бы выглядеть на доске:

Нефункциональные требования

Подготовка

Планирование подхода

Прежде чем переходить к проектированию системы, важно на секунду остановиться и продумать стратегию. К счастью, для "продуктовых" задач план обычно простой: последовательно собирать дизайн, проходя по функциональным требованиям одно за другим. Так вы сохраните фокус и не утонете в деталях.

Когда функциональные требования удовлетворены, используйте нефункциональные требования, чтобы определить направления для погружения в детали, где это необходимо.

Проектирование API

Начнем с определения основных сущностей, это поможет спроектировать API. Пока не обязательно знать каждое поле или колонку, но если у вас уже есть представление о том, что там будет - можно это записать.

Чтобы покрыть основные функциональные требования, нам понадобятся следующие сущности:

Problem: хранит условие задачи, тест‑кейсы и ожидаемый результат.
Submission: хранит отправленное пользователем решение и результат прогона по тест‑кейсам.
Leaderboard: хранит таблицу лидеров соревнований.

В реальном интервью достаточно короткого списка как выше - главное проговорить сущности и убедиться, что вы и интервьюер одинаково их понимаете. Можно добавить сущность User, но обычно она и так подразумевается и отдельно не выделяется.

API - основной интерфейс, через который пользователи взаимодействуют с системой. Его полезно определить с самого начала, поскольку он направляет high-level дизайн. Обычно нам нужен один эндпоинт на каждое функциональное требование.

Начнем с просмотра списка проблем, у нас будет простой GET эндпоинт, который возвращает список. Также можно добавить базовую нумерацию страниц, поскольку у нас гораздо больше проблем, чем может быть возвращено в одном запросе или отображено на одной странице.

GET /problems?page=1&limit=100 -> Partial<Problem>[]

Здесь Partial взят из TypeScript и указывает, что мы возвращаем только подмножество сущности Problem. Обычно нам нужны только title, id, level и, возможно, tags или category. Нет необходимости возвращать здесь полное условие задачи и заглушки кода. Формат записи не важен - важно, чтобы вы ясно объяснили это интервьюеру.

Далее нам понадобится еще один GET эндпоинт для просмотра конкретной проблемы. Он принимает ID проблемы (который мы получили, когда пользователь выбрал проблему из списка) и возвращает полное описание проблемы и заглушку кода на выбранном языке (параметр language).

GET /problems/:id?language={language} -> Problem

Затем нам понадобится POST эндпоинт для отправки пользовательского решения проблемы. Он принимает ID проблемы и отправленный пользователем код и возвращает результат выполнения кода для тест-кейсов.

POST /problems/:id/submissions -> Submission
{
  code: string,
  language: string
}

// заметим, что ID пользователя берется из сессии или auth-токена и
// не передается в теле или параметрах пути запроса

Наконец, нам понадобится GET эндпоинт для просмотра таблицы лидеров соревнований в real-time режиме. Он возвращает ранжированный список пользователей на основе их результатов в соревновании.

GET /leaderboard/:competitionId?page=1&limit=100 -> Leaderboard

Проектирование API и сущностей

Всегда учитывайте безопасность API. Часто кандидаты передают в тело запроса userId или метки времени. Это красный флаг для интервьюера: любые данные от клиента можно подделать. Пользовательские данные должны приходить из сессии или auth-токена, а метки времени должны генерироваться на сервере.

Высокоуровневый дизайн

Определив наши основные сущности и API, мы можем перейти к high‑level дизайну. Здесь мы описываем компоненты системы и их взаимодействие. Мы снова можем просмотреть наши функциональные требования одно за другим и убедиться, что у нас есть набор компонентов или сервисов для их удовлетворения. Во время интервью важно явно проговаривать, как данные перемещаются в системе и где хранится состояние.

Часто для систем, которые проектируются в рамках собеседований, лучше подходит микросервисная архитектура, однако это не всегда так. Для небольших систем, подобных нашей, более подходящей может быть монолитная архитектура: в ней меньше накладных расходов и проще поддержка. С учетом вышесказанного давайте рассмотрим простую клиент-серверную архитектуру.

1. Пользователи могут просматривать список задач

Для просмотра списка проблем нам понадобится простой сервер, который сможет получить список проблем из базы данных и вернуть его пользователю. Этот сервер также будет отвечать за обработку разбиения на страницы.

Просмотр списка задач

Основные компоненты:

Основной сервер: принимает запросы и возвращает данные. Сейчас у него один эндпоинт, но мы добавим остальные далее.
База данных: хранит все проблемы. Нам нужно убедиться, что база данных правильно проиндексирована для поддержки разбиения на страницы. Подойдет и SQL, и NoSQL. Мы выбрали NoSQL (например, DynamoDB), потому что сложные запросы не нужны, а тест‑кейсы можно вложить в Problem, для простоты не будем создавать отдельную сущность.

Схема Problem может выглядеть следующим образом:

{
  id: string,
  title: string,
  description: string,
  level: string,
  tags: string[],
  codeStubs: {
    python: string,
    javascript: string,
    typescript: string,
    ...
  },
  testCases: { type: string, input: string, output: string }[]
}

Кодовые заглушки для каждого языка либо заполняются администратором вручную, либо, могут генерироваться с помощью LLM на основе примера одного языка.

2. Пользователи могут просматривать задачу и писать решение на нескольких языках

Чтобы просмотреть проблему, клиент отправляет запрос GET /problems/:id, и сервер извлечет из базы и вернет полное описание проблемы и заглушку кода. Мы будем использовать редактор Monaco, чтобы пользователи могли писать код своего решения в браузере.

Просмотр конкретной задачи

3. Пользователи могут отправлять свое решение и получать результат прогона по тест‑кейсам

Пока все было просто, но здесь все становится интереснее. Когда пользователь отправляет свое решение, нам нужно запустить его код для тест‑кейсов и вернуть результат. Здесь нам нужно быть осторожными с тем, как мы запускаем код, чтобы гарантировать, что он не приведет к сбою нашего сервера и не скомпрометирует нашу систему.

Давайте разберем некоторые варианты выполнения кода:

Хотя serverless функции являются отличным вариантом, и их определенно можно использовать, мы продолжим разбор выбрав подход с контейнерами, поскольку ожидаем относительно стабильную нагрузку при обработке решений пользователей. Давайте обновим наш высокоуровневый дизайн, включив в него сервис контейнеров, который будет запускать пользовательский код.

Паттерн: Управление длительными задачами

Выполнение кода в LeetCode может занимать несколько секунд: контейнеры выполняют код решения для сотен тест‑кейсов. Это пример паттерна Длительные задачи, где API возвращает ID задачи сразу, а фоновые воркеры делают тяжелую работу (транскодирование видео, генерацию отчетов, обработку данных), избегая таймаутов и позволяя системе масштабироваться.

Подробнее о паттерне

Запуск кода в контейнере

Когда пользователь отправляет решение, система делает следующее:

Сервер принимает код и id задачи и отправляет его в соответствующий контейнер для нужного языка.
Изолированный контейнер запускает код и возвращает результат серверу.
Сервер сохраняет результат в базу данных и возвращает его клиенту.

4. Пользователи могут просматривать таблицу лидеров соревнований в реальном времени

Сначала определим, что такое соревнование:

длительность 90 минут
10 задач
до 100k участников
результат - число решенных задач за 90 минут; при равенстве - время решения всех задач (от начала соревнования)

Самое простое, что мы можем сделать, когда пользователи запрашивают таблицу лидеров через /leaderboard/:competitionId, запрашивать данные в базе данных, выполняя группировку и сортировку.

В SQL это будет выглядеть так:

SELECT userId, COUNT(*) as numSuccessfulSubmissions
FROM submissions
WHERE competitionId = :competitionId AND passed = true
GROUP BY userId
ORDER BY numSuccessfulSubmissions DESC

В NoSQL (например, DynamoDB) competitionId должен быть ключом партиционирования, по которому мы извлекаем все элементы, а затем группируем и сортируем.

Как только мы получили таблицу лидеров, мы возвращаем ее клиенту для отображения. Чтобы поддерживать актуальность информации, клиент будет запрашивать таблицу лидеров каждые 5 секунд.

Таблица лидеров

Связываем все вместе:

Пользователь запрашивает таблицу лидеров через /leaderboard/:competitionId.
Сервер запрашивает базу данных по успешным решениям для соревнования.
Через запрос или в памяти мы строим таблицу лидеров, ранжируя пользователей по числу успешных решений и времени.
Возвращаем таблицу лидеров клиенту.
Клиент повторяет запрос через 5 секунд, чтобы обновить данные.

Внимательный читатель уже заметил, что это решение не очень хорошее: оно значительно нагружает базу данных. Мы обсудим оптимизации в следующем разделе.

Потенциальные погружения в детали

Когда основные функциональные требования выполнены, пришло время углубиться в нефункциональные.

Степень, в которой кандидат должен вести интервью, определяется его уровнем. Например, для Middle кандидата вполне разумно, чтобы интервьюер задавал вопросы по деталям реализации. Однако на собеседованиях с Senior и Staff кандидатами ожидаемый уровень инициативы и ответственности повышается. Кандидатам следует заранее предвидеть сложности и выявлять потенциальные проблемы в своем дизайне, одновременно предлагая решения и компромиссы.

1. Как обеспечить изоляцию и безопасность при запуске кода?

Запустив наш код в контейнере, мы уже сделали большой шаг к обеспечению безопасности и изоляции. Но есть несколько вещей, которые мы хотим включить в настройку контейнера для повышения безопасности:

Файловая система только для чтения: чтобы пользователи не могли выполнять запись в файловую систему, мы можем смонтировать каталог с пользовательским кодом только для чтения и записывать любые выходные данные во временный каталог, который удаляется после завершения.
Ограничение CPU и памяти: чтобы пользователи не потребляли чрезмерное количество ресурсов, мы можем установить ограничения на CPU и память для контейнера. Если эти ограничения будут превышены, контейнер будет ликвидирован.
Таймаут: чтобы пользовательский код не исполнялся бесконечно долго, мы можем использовать таймаут, который убивает контейнер, если он выполняется дольше заранее определенного срока, например, 5 секунд. Это также поможет нам выполнить наше требование о возврате результатов отправки в течение 5 секунд.
Ограничение сети: чтобы пользователи не могли выполнять сетевые запросы, мы можем отключить доступ к сети в контейнере. Работая в экосистеме AWS, мы можем использовать виртуальное частное облако (VPC), Security Groups и NACLs для ограничения всего исходящего и входящего трафика, за исключением предопределенных соединений.
Ограничение системных вызовов (seccomp): мы не хотим, чтобы пользователи могли совершать системные вызовы, которые могут поставить под угрозу хост-систему. Мы можем использовать seccomp, чтобы ограничить вызовы, которые может выполнять контейнер.

Обратите внимание, что на собеседовании от вас, скорее всего, не ожидают подробностей о том, как вы будете реализовывать каждую из этих мер безопасности. Вместо этого сосредоточьтесь на концепциях высокого уровня и на том, как они помогут защитить систему. Если ваш интервьюер интересуется определенной областью, он попросит вас погрузиться глубже. Cкорее всего, достаточно просто сказать: "Мы будем использовать Docker-контейнеры, ограничивая доступ к сети, устанавливая лимиты CPU и памяти, а также обеспечивая таймаут выполнения кода".

Безопасность запуска пользовательского кода

2. Как сделать получение таблицы лидеров эффективнее?

Как мы отмечали в high‑level дизайне, текущий подход слишком неэффективный. Давайте рассмотрим еще несколько вариантов:

Таблица лидеров на Redis Sorted Sets

Многие кандидаты, которым задают этот вопрос, предлагают подключение через Websockets для обновлений в реальном времени. Хотя такое решение возможно, оно было бы излишним для нашей системы, учитывая небольшое количество пользователей и приемлемую 5-секундную задержку.

Решение с сортированными множествами Redis и polling обеспечивает хороший баланс между обновлениями в реальном времени и простотой системы. Оно также может быть легко расширено, например, если окажется, что 5-секундный интервал слишком частый, мы можем легко его отрегулировать. Мы могли бы даже реализовать стратегию прогрессивного polling, при которой мы запрашиваем таблицу на клиенте чаще (например, каждые 2 секунды) в течение последних нескольких минут соревнования и реже (например, каждые 10 секунд) в другое время.

Staff кандидаты должны быть особенно эффективны в понимании этого баланса. Они могут описать более сложное решение, но ясно формулируют, почему оно является излишним для данной системы.

3. Как масштабировать систему для соревнований с 100 000 участников?

Основная проблема - всплеск трафика во время соревнования, который может перегрузить контейнеры, в которых выполняется пользовательский код. 100k пользователей - это все еще немного, и наш основной сервер за счет горизонтального масштабирования должен справиться с этой нагрузкой без каких-либо проблем. Однако, поскольку выполнение кода требует большого количества ресурсов CPU, нам нужно быть осторожными с тем, как мы управляем контейнерами.

Очередь для обработки пользовательских решений

Хотя добавление очереди можно посчитать избыточным, мы все же выбрали этот подход, поскольку он также позволяет реализовать повторные попытки в случае сбоя контейнера. Кроме того, наличие буфера поможет спокойно спать по ночам, зная, что мы не потеряем ни одного пользовательского решения, даже в случае внезапного всплеска трафика (чего сложно ожидать в этой системе).

Здесь нет правильного или неправильного ответа, при разных дополнительных условиях мы можем выбрать разные подходы. Взвешивание и сравнение плюсов и минусов каждого подхода является ключевым моментом на собеседовании.

4. Как система будет запускать тест‑кейсы?

Еще один дополнительный вопрос, который можно задать: "Как бы вы это сделали? Как бы вы взяли тест-кейсы и запустили их с пользовательским кодом на любом языке?". Это выводит кандидатов из режима рисования прямоугольников и заставляет их задуматься о фактической реализации.

Очевидно, что писать тест‑кейсы под каждый язык - кошмар. Вместо этого мы напишем один набор тест‑кейсов на задачу и запустим его на любом языке.

Для этого нам понадобится стандартизированный способ сериализации входных и выходных данных каждого тест-кейса, а также тестовая программа для каждого языка, которая может десериализовать эти входные данные, передать их в пользовательский код и сравнить выходные данные с десериализованными ожидаемыми выходными данными.

Например, возьмем задачу Максимальная глубина бинарного дерева. В Go функция принимает указатель на TreeNode:

/**
 * Definition for a binary tree node.
 * type TreeNode struct {
 *     Val int
 *     Left *TreeNode
 *     Right *TreeNode
 * }
 */
func maxDepth(root *TreeNode) int {
 
}

Чтобы запустить этот код, нам понадобится файл TreeNode, который находится в том же каталоге, что и пользовательский код в контейнере. Мы берем стандартизированные сериализованные входные данные для тест-кейса, десериализуем их в объект TreeNode и передаем в пользовательский код. Тест-кейс может выглядеть примерно так:

{
  "id": 1,
  "title": "Максимальная глубина бинарного дерева",
  ...
  "testCases": [
    {
      "type": "tree",
      "input": [3,9,20,null,null,15,7],
      "output": 3
    },
    {
      "type": "tree",
      "input": [1,null,2],
      "output": 2
    }
  ]
}

Здесь мы решили сериализовать сущность Дерево в массив, используя обход по порядку (inorder). Каждый язык будет иметь свою собственную версию TreeNode, которая может десериализовать массив из input в TreeNode для передачи в пользовательский код.

Финальный дизайн

Соберем все вместе, итоговый дизайн может выглядеть так:

Финальный дизайн

Что ожидается на каждом уровне?

Хорошо, мы обсудили много всего. Возникает резонный вопрос: "сколько из этого реально ожидается от меня на интервью?" Разберем по уровням.

Middle

Ширина vs глубина: от Middle кандидата чаще ожидается ширина кругозора и знаний (примерно 80% vs 20%). Вы должны собрать понятный высокоуровневый дизайн, закрывающий все функциональные требования, но многие компоненты могут оставаться абстракциями, которые вы проработали и обсудили с интервьюером на поверхностном уровне.

Проверка базовых знаний: интервьюер будет прощупывать базу, чтобы удостовериться, что вы понимаете, что делает каждый компонент. Например, добавив API Gateway, ожидайте вопрос "что он делает" и "как работает".

Смешанный формат ведения: вы должны уверенно вести ранние стадии интервью, но не обязательно проактивно находить все проблемы дизайна. Нормально, если позже интервьюер будет вести обсуждение, задавая вопросы и ставя дополнительные задачи.

Задача LeetCode: от Middle кандидата ожидается четко определенный API и модель данных, а также высокоуровневый дизайн, который удовлетворяет всем функциональным требованиям. Также важно понимать необходимость безопасного изолированного запуска кода.

Senior

Глубина экспертизы: от Senior кандидата ожидания смещаются к глубине - примерно 60% ширины и 40% глубины. Нужно уметь уходить в детали там, где у вас есть практический опыт.

Продвинутый дизайн системы: вы должны быть знакомы с современными принципами проектирования систем: различными технологиями, вариантами их использования и тем, как они сочетаются друг с другом.

Аргументация решений: вы должны уметь ясно объяснять плюсы/минусы архитектурных решений и их влияние на масштабирование, производительность и поддерживаемость, проговаривая компромиссы.

Проактивность и решение проблем: вы должны продемонстрировать сильные навыки решения проблем и проактивный подход. Это подразумевает обнаружение потенциальных проблем в ваших проектах и предложение улучшений. Вам необходимо уметь выявлять и устранять узкие места, оптимизировать производительность и обеспечивать надежность системы.

Задача LeetCode: от Senior кандидата ожидается, что вы быстро пройдете высокоуровневый дизайн и потратите время на детальное обсуждение того, как запускать код безопасно и изолированно, какие существуют компромиссы между контейнерами/VM/serverless и аргументируете свой выбор. Будет хорошо, если вы сможете также рассказать, как планируете запускать тест‑кейсы с пользовательским кодом.

Staff+

Акцент на глубину: от Staff+ кандидата ожидается глубокий разбор нюансов - примерно 40% ширины и 60% глубины. Важна демонстрация того, что, даже если вы не решали именно эту задачу раньше, вы решали достаточно похожих задач в реальном мире, чтобы уверенно спроектировать решение, опираясь на опыт.

Интервьюер понимает, что вы знаете основы (REST, нормализация данных и т. п.), так что вы можете быстро пройти это на high-level дизайне и перейти к самому интересному.

Высокая проактивность: на этом уровне ожидается, что вы будете самостоятельно выявлять и решать проблемы. Это предполагает не только реагирование на проблемы по мере их возникновения, но и их прогнозирование и реализацию упреждающих решений.

Практическое применение технологий: важно уметь говорить о применяемых технологиях не только в теории, но и как это делается на практике - конфигурации, эксплуатационные нюансы, типичные проблемы.

Решение проблем: ожидаются сильные навыки решения проблем с учетом факторов масштабирования, производительности, надежности и поддерживаемости.

Задача LeetCode: эту задачу редко дают Staff+ кандидатам. Тем не менее, от таких кандидатов ожидается, что они смогут вести весь разговор, заранее выявляя потенциальные проблемы с дизайном и предлагая решения для их устранения. Они должны быть в состоянии обсуждать компромиссы между различными подходами и обосновывать свои решения. В идеале они должны спроектировать очень простую систему, без overengineering-а, но с ясным планом масштабирования в случае необходимости.