Аренда выделенных и виртуальных GPU серверов с профессиональными картами и игровыми картами. Выберете готовые серверы с оптимальными конфигурациями для 3D-моделирования, рендеринга, машинного обучения или соберите сервер индивидуальной конфигурации.
Для виртуальных серверов мы пробрасываем GPU карту как PCIe устройство в KVM виртуальные машины. GPU карта используется виртуальной машиной эксклюзивно и не может быть использована другими пользователями. Производительность GPU в виртуальных машинах соответствует производительности GPU карт в выделенных серверах.
Готовые GPU серверы предоставляются в стандартных конфигурациях. Если вам необходима индивидуальная конфигурация, воспользуйтесь онлайн-конфигуратором.
Закажите сервер c GPU-картой и предустановленным ПО - получите готовую рабочую среду всего в пару кликов
VPS / VDS серверы с выделенными GPU картами для эксклюзивного использования
Тестовые серверы предоставляются только компаниям. Рассматриваем заявки, в которых указан корпоративный e-mail
При аренде VPS сервера с GPU вы получаете все его ресурсы:
Помимо этого, вы получаете возможность самостоятельно установить и использовать любое необходимое ПО для работы при почасовой аренде сервера с GPU, а также при аренде оборудования на любой продолжительный срок.
Уже несколько лет компания NVIDIA наложила ограничения на использование собственных видеокарт в ЦОДах, однако в соответствии с правилами компании, запрет не действует, если ЦОД допускает применение блокчейна.
Поэтому мы совершенно легально предоставляем клиентам выделенные серверы с видеокартами и драйверами от NVIDIA.
Мы постоянно обновляем парк оборудования, поэтому вы можете связаться с нашими специалистами, они скажут, появится ли в ближайшее время необходимая вам видеокарта.
GPU, или графические процессоры (Graphics Processing Units), — это специализированные видеокарты, которые устанавливаются на сервер в дополнение к традиционным CPU. Конфигурация такого сервера может включать от одного до нескольких GPU.
GPU-карты значительно ускоряют параллельные вычисления. Их сфера применения давно вышла за пределы обработки графики — они идеально подходят для задач, где требуется одновременная обработка большого количества процессов: обучение нейросетей, аналитика больших данных, 3D-рендеринг, финансовое моделирование и многое другое.
На профессиональном уровне это называется параллельными вычислениями, или CUDA-вычислениями — по названию технологии, разработанной компанией NVIDIA.
GPU-сервер - это физический или виртуальный сервер, оснащенный одной или несколькими видеокартами (графическими ускорителями). GPU содержат тысячи параллельных вычислительных ядер, что делает их значительно быстрее обычных CPU для задач машинного обучения, обработки изображений и видео, 3D-рендеринга и научных вычислений.
Цена зависит от модели GPU, количества карт и конфигурации. VPS с RTX 4090 (24 ГБ VRAM) - от 15 000–25 000 ₽/мес. Выделенный сервер с H100 - значительно дороже. Доступна почасовая оплата для краткосрочных задач. Актуальные цены - на сайте HOSTKEY.
Для моделей до 13B параметров - RTX 4090 или RTX 5090 (файнтюнинг через LoRA). Для 30B–70B - A100 80 ГБ или RTX 6000 PRO 96 ГБ. Для 70B+ (полное обучение) - кластер из 4–8 карт H100 с NVLink.
Для запуска 7B–13B моделей (Llama 3, Mistral, Qwen 2.5) хватает RTX 4090 (24 ГБ). Для 70B моделей - A100 80 ГБ или H100. Для массового инференса с минимальной задержкой - H100 с квантизацией через Transformer Engine.
Да. HOSTKEY предлагает почасовую и помесячную оплату. Почасовая аренда удобна для обучения моделей, бенчмарков и экспериментов, когда сервер нужен на часы или дни.
HOSTKEY предлагает GPU-серверы в России (Москва), Нидерландах, Финляндии, Германии, Исландии, Франции, США и Турции.
Выделенный (bare metal) - физическая машина целиком ваша. Максимальная производительность, нет overhead виртуализации. Облачный (виртуальная машина с GPU) - быстрее развертывается, удобнее для краткосрочных задач, GPU передается через passthrough без деления ресурсов.
Да. На выделенных серверах можно установить Docker, Kubernetes, NVIDIA Container Toolkit, Jupyter, PyTorch, TensorFlow и любое другое ПО. Часть приложений доступна через маркетплейс HOSTKEY для быстрой предустановки.
GPU-сервер - это сервер с одной или несколькими видеокартами (графическими ускорителями), предназначенный для задач, где обычный процессор не справляется: обучение нейросетей, инференс больших языковых моделей (LLM), 3D-рендеринг, обработка видео и высокопроизводительные вычисления (HPC). HOSTKEY предлагает в аренду выделенные и виртуальные GPU-серверы с картами NVIDIA H100, H200, A100, RTX 5090, RTX 6000 PRO, RTX 4090, RTX 3090 и AMD Radeon - в дата-центрах России, Европы, Исландии и США.
HOSTKEY предлагает два формата: выделенные серверы (bare metal) с полным доступом к оборудованию и виртуальные машины с выделенной видеокартой через GPU passthrough - ресурсы GPU не делятся с другими пользователями.
NVIDIA H100 - флагман для обучения LLM. 80 ГБ HBM2e, пропускная способность памяти 2 ТБ/с, 456 тензорных ядер, встроенный Transformer Engine для ускорения работы с моделями-трансформерами. В одном сервере - до 8 карт H100, объединенных через NVLink для обмена данными между GPU со скоростью до 900 ГБ/с. Оптимален для обучения моделей с десятками и сотнями миллиардов параметров.
NVIDIA H200 - развитие H100 с увеличенным объемом видеопамяти (141 ГБ HBM3e) и пропускной способностью 4.8 ТБ/с. Подходит для работы с особенно крупными моделями, где ограничением становится объем VRAM.
NVIDIA A100 - предыдущее поколение, по-прежнему востребованное. 80 ГБ HBM2e (или 40 ГБ в младшей версии), 6912 CUDA-ядер, 432 тензорных ядра. Хороший баланс цена/производительность для обучения и инференса моделей среднего размера. Поддержка NVLink и multi-GPU.
NVIDIA RTX 5090 - новейшая карта на архитектуре Blackwell. 32 ГБ GDDR7, поддержка DLSS 4 и нейрошейдеров. Для инференса моделей до 30B параметров, файнтюнинга с LoRA/QLoRA, и задач, где не нужна HBM-память.
NVIDIA RTX 6000 PRO - профессиональная карта Blackwell с 96 ГБ GDDR7. В 3 раза больше видеопамяти, чем у RTX 5090, и в 4 раза больше, чем у RTX 4090. Для работы с моделями и датасетами корпоративного масштаба, которые не помещаются в 24–32 ГБ VRAM.
NVIDIA RTX 4090 - 24 ГБ GDDR6X, 16 384 CUDA-ядра. Проверенный выбор для инференса моделей до 13B параметров, файнтюнинга, генерации изображений (Stable Diffusion, Flux), 3D-рендеринга. По соотношению цена/производительность - один из лучших вариантов для задач, не требующих огромного объема VRAM.
NVIDIA RTX 3090 - 24 ГБ GDDR6X. Бюджетный вариант для инференса небольших моделей, экспериментов и 3D-рендеринга.
Для задач, совместимых с ROCm (OpenCL, PyTorch с ROCm-бэкендом). Альтернатива NVIDIA для определенных вычислительных сценариев.
Все GPU-серверы строятся на базе процессоров AMD EPYC или Intel Xeon Scalable последних поколений, с памятью DDR5 ECC и хранилищем на NVMe SSD.
Видеокарта выбирается не по «мощности вообще», а под конкретную задачу. Вот практические рекомендации.
Обучение LLM (Training). Модели с 70B+ параметров - связка из 4–8 карт H100 или H200 с NVLink. Модели 7B–30B - 1–2 карты A100 80 ГБ или H100. Ключевое ограничение - объем VRAM и пропускная способность interconnect между GPU.
Файнтюнинг (Fine-tuning). Для LoRA/QLoRA файнтюнинга моделей до 13B хватает RTX 4090 (24 ГБ) или RTX 5090 (32 ГБ). Для моделей 30B–70B - A100 80 ГБ или RTX 6000 PRO (96 ГБ).
Инференс (Inference). Запуск готовых моделей. Для 7B–13B моделей (Llama 3, Mistral, Qwen) - RTX 4090 или RTX 5090. Для 70B+ - A100 или H100. Для массового инференса с низкой задержкой - H100 с INT8/FP8 квантизацией через Transformer Engine.
3D-рендеринг.RTX 4090 и RTX 5090 - отличный выбор для Blender, V-Ray, OctaneRender. Для профессиональных студий - RTX 6000 PRO с 96 ГБ VRAM (крупные сцены без out-of-memory ошибок).
Обработка видео и транскодинг.RTX 4090 с аппаратным NVENC-кодеком. Для параллельной обработки нескольких потоков - 2–4 карты.
Computer Vision. Зависит от размера модели. Для YOLO, ResNet и подобных - хватает RTX 4090. Для обучения крупных vision-трансформеров - A100 или H100.
Научные вычисления (HPC). Молекулярная динамика, климатическое моделирование, CFD - H100 с FP64-производительностью или A100. Многие HPC-коды оптимизированы под CUDA и масштабируются на несколько GPU.
Выбирать GPU-сервер по «количеству гигабайт» - все равно что выбирать машину по объему багажника. Вот параметры, которые реально определяют производительность.
VRAM (видеопамять). Определяет, какого размера модель или датасет помещается на GPU без свопинга на CPU. 24 ГБ (RTX 4090) - инференс моделей до 13B в FP16 или 30B в 4-bit квантизации. 80 ГБ (A100, H100) - обучение моделей 30B–70B. 96 ГБ (RTX 6000 PRO) - работа с корпоративными моделями и датасетами.
Тип памяти.HBM2e/HBM3 (H100, A100) - огромная пропускная способность (2–4.8 ТБ/с), критично для обучения. GDDR6X/GDDR7 (RTX серия) - достаточно для инференса, но bandwidth ниже (около 1 ТБ/с).
CUDA-ядра. Число параллельных вычислительных блоков. Больше - быстрее обрабатываются матричные операции. H100: 14 592. RTX 4090: 16 384. RTX 5090: 21 760.
Тензорные ядра. Специализированные блоки для матричных операций в mixed precision (FP16, FP8, INT8). В H100 - тензорные ядра четвертого поколения с Transformer Engine, который автоматически переключается между FP8 и FP16 для максимальной скорости при обучении трансформеров.
NVLink. Высокоскоростной interconnect между GPU. Позволяет объединить память нескольких карт и обмениваться данными со скоростью до 900 ГБ/с (H100 NVLink). Без NVLink multi-GPU обучение упирается в пропускную способность PCIe.
Выделенный сервер (bare metal) - вы получаете физическую машину целиком. Максимальная производительность, нулевой overhead от виртуализации, полный контроль: ставите свои драйверы, ядро, CUDA Toolkit, Docker, Kubernetes. Для серьезного обучения моделей и продакшн-инференса - оптимальный вариант.
Виртуальная машина с GPU - через GPU passthrough видеокарта целиком передается виртуальной машине. Ресурсы не делятся с другими пользователями. Быстрее в развертывании (минуты, а не часы), удобнее для краткосрочных задач: запустил обучение, получил результат, удалил сервер.
GPU-кластер - несколько серверов, объединенных высокоскоростной сетью (до 100 Гбит/с). Для распределенного обучения LLM, которое не помещается на один сервер. HOSTKEY собирает кластеры из серверов с H100/A100 под заказ.
Один NVIDIA H100 стоит от $30 000. Сервер с 8 картами H100, процессорами EPYC и NVMe - от $300 000 и выше. Плюс доставка, размещение в ЦОД, электричество, охлаждение, обслуживание. Аренда позволяет получить такое железо за фиксированную ежемесячную плату.
Почасовая оплата. Если обучение модели занимает 72 часа - вы платите за 72 часа, а не за месяц. Для экспериментов и R&D это радикально снижает затраты.
Масштабирование. Сегодня нужен один сервер с RTX 4090 для прототипа. Завтра - кластер из восьми H100 для обучения. Аренда позволяет масштабироваться без капитальных затрат.
Железо устаревает. H100 вышел в 2023 году. В 2025 году появился Blackwell (RTX 5090, B200). Купленный сервер за $300K через два года уже не топовый. При аренде вы переключаетесь на новое поколение без потерь.
HOSTKEY предоставляет GPU-серверы в дата-центрах России (Москва), Нидерландов (Амстердам), Финляндии, Германии, Исландии, Франции, США и Турции.
Что доступно:
Что входит:
Как заказать:
Арендуйте GPU-сервер в HOSTKEY. От RTX 4090 для экспериментов до кластера H100 для обучения LLM. Россия, Европа, США. Почасовая и помесячная оплата.