Прескочи към информацията за продукта
1 od 7

Kentino sro

K-AI 384 Rome RTXPro6000 — 4× RTX Pro 6000 Blackwell Server Edition (384 GB ECC VRAM)

K-AI 384 Rome RTXPro6000 — 4× RTX Pro 6000 Blackwell Server Edition (384 GB ECC VRAM)

Обичайна цена EUR € 46.583,00
Обичайна цена Цена при разпродажба EUR € 46.583,00
zľava Изчерпано
С включени данъци. Доставката се изчислява при плащане.

K-AI 384 Rím RTXPro6000 8000TOPS

384 GB ECC VRAM server dátového centra
4x RTX Pro 6000 Server Edition | EPYC Milan | 8 000 TOPS INT8

8 000
TOPS INT8
384 GB
fond ECC VRAM
fp8
Rodák z Blackwellu
Pasívne
chladenie dátového centra

Publikované externé referencie. Nemerané na hardvéri Kentino.

Rackový inferenčný server s výškou 4U, štyrmi pasívnymi dátovými kartami NVIDIA RTX Pro 6000 Blackwell Server Edition (každá s kapacitou 96 GB ECC) spojenými s 384 GB ECC VRAM, jedným procesorom AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4-2666 ECC, 2 TB NVMe bootovaním a duálnym synchronizovaným 2.5 kW ATX zdrojom. Kremík Blackwell s natívnou akceleráciou FP8. Pasívne chladenie s prúdením vzduchu pre šasi dátového centra. Beží na systémoch DeepSeek V3 Q3, Mistral Large 3, Qwen3-Coder-480B a všetkých hlavných otvorených modeloch Frontier.

technické vybavenie

Zložka detail
GPU 4x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC (pasívny chladič pre dátové centrá, 600 W TGP, PCIe 5.0 x16, 2000 INT8 TOPS/karta, natívna FP8)
fond VRAM 384 GB agregovanej ECC pamäte na 4 kartách
CPU AMD EPYC 7643 Milan (48C/96T, 225 W, 128 liniek PCIe 4.0)
Základná doska ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
Systémová RAM 384 GB DDR4-2666 ECC RDIMM (6x 64 GB — 2 sloty DIMM voľné pre rozšírenie na 512 GB)
Bootovanie / úložisko 2 TB NVMe M.2 (PCIe 4.0 x4)
Zdroj 2x 2.5 kW ATX s synchronizačným káblom pre dva zdroje (agregát 5 kW)
Podvozok 4U montáž do racku
Chladenie Vežový chladič SP3 (trieda Arctic Freezer 4U-M) + smerované prúdenie vzduchu spredu dozadu (3x 120 mm predný vstup + 1x 120 mm zadný výstup). Pasívne grafické karty – vyžadujú prúdenie vzduchu v šasi dátového centra.
sieť Duálny 10 GbE integrovaný (Intel X550)

Napájacia obálka

  • Spotreba grafického procesora: 4 x 600 W = 2 400 W
  • Celkový výkon systému pri plnom zaťažení: ~2 775 W
  • Celkový výkon zdroja: 5 000 W (duálny synchronizovaný zdroj 2.5 kW) — 44.5 % rezerva
  • Duálny zdroj PSU pre rozdelené napájanie – porucha jedného zdroja = strata 2 grafických kariet alebo 2 grafických kariet + základnej dosky

Topológia jazdných pruhov

ROMED8-2T odhaľuje 7x PCIe 4.0 x16 priamo z EPYC Milan. Štyri obsadené sloty – tri voľné pre sieťovú kartu / úložisko / telemetriu. RTX Pro 6000 je kremík s podporou Gen5; na tejto platforme beží Gen4 na plný x16 – žiadne úzke miesto pre šírku pásma pre inferenciu. Žiadny prepínač PCIe. Žiadny NVLink.

Čo môžete spustiť

S 384 GB združenej ECC VRAM na natívnom kremíku Blackwell FP8 tento server pohodlne prevádzkuje DeepSeek V3 / R1 s rýchlosťou Q3 na karte, Mistral Large 3 Q3, GLM-5 Q3, Qwen3-Coder-480B Q3 a Llama 3.3 70B bf16 rezidentne na jednej karte (96 GB/karta).

LLM – text / uvažovanie / kódovanie

Čínska hranica

  • DeepSeek V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 Q3 (~290 GB) pohodlne na karte (~30-40 tok/s jeden tok, publikovaná referencia); FP8 natívny (~670 GB s rezervou RAM)
  • Qwen3-Coder-480B-A35B Q3 (~350 GB obmedzené s únikom RAM) — SOTA otvorený kódovací agent (~18-25 tok/s jeden, publikovaná referencia)
  • Qwen3-235B-A22B Q6/Q8 (~200-280 GB) s veľmi dlhým ctx a dávkovým spracovaním pre viacerých používateľov
  • GLM-5 / GLM-5.1 Q3 (~317 GB) – čínska hranica, kódovanie blízko verzie Claude Opus 4.6
  • Kimi-K2 1.58-bitový UD (~240 GB) — agent s biliónmi parametrov pri skutočnej priepustnosti
  • Hunyuan-Veľký 389B/52B Q4 (~220 GB), natívny FP8 (~390 GB úložisko)
  • ERNIE-4.5-424B-A47B 4. štvrťrok (~240 GB); MiniMax-M1 4. štvrťrok (~260 GB) 1M-ctx
  • Lama 3.3 70B bf16 umiestnený na jednej karte (96 GB/karta — nie je potrebný tenzorový paralelný procesor)

Západná hranica

  • Mistral Large 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB) — otvorené váhy na hranici západnej pologule (~20-30 tok/s jednotlivo, publikovaná referencia)
  • Flame 4 Maverick (400B/17B) Q4 (~232 GB) so štedrým rozpočtom KV (~45-55 tok/s jeden, publikovaná referencia)
  • Llama-3.1-Nemotron Ultra 253B 4. – 6. štvrťrok (~119 – 207 GB)
  • gpt-oss-120b Natívny MXFP4 (80 GB) s masívnym priestorom pre súbežné úložiská
  • Pixtral Large / Mistral Large 2 bf16 (~248 GB); Devstral 2 123B bf16 — 256k otvorené kódovanie
  • Lama 3.3 70B bf16 na jednej karte; možné 4 súbežné nasadenia 70B

Modely vizuálno-jazykového vnímania

Qwen3-VL-235B-A22B bf16 (~240 GB); InternVL3.5-241B-A28B Q4 (~135 GB); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16 (~248 GB); Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V 106B bf16 na TP. Blackwell fp8 poskytuje ~2x vyššiu priepustnosť na inferencii Vision-Tower v porovnaní s Ada.

Generovanie obrazu

FLUX.1 [dev] / Kontext / Nástroje v natívnom režime FP8 (~15-20 s na obraz 1024x1024 na jednej RTX Pro 6000, publikovaná referencia); SD 3.5 Large; HunyuanImage-2.1 (17B natívne 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; 4x súbežné ComfyUI workery.

Generovanie videa

Wan 2.2 T2V-A14B / I2V-A14B duálny expert bf16; HunyuanVideo 13B bf16 oba experty; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.

Zvuk / Reč / TTS

  • ASR: Whisper v3 veľký / turbo; Parakeet-TDT 1.1B; Canary 1B; Qwen3-ASR; SenseVoice
  • TTS: CosyVoice 2/3; Kokoro; Stable Audio Open; XTTS v2; Step-Audio-EditX
  • V reálnom čase / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
  • Hudba / Zvukové efekty: MusicGen / AudioGen / Bark / SeamlessM4T

Poskytovanie viacerých modelov / viacerých nájomníkov

  • DeepSeek V3 Q3 + súbežný 70B + FLUX.1 + Whisper pre všetkých rezidentov
  • 4-cestná tenzorovo paralelná trieda na 350-400B v 4. štvrťroku
  • Izolácia nájomníka na kartu – jeden 96 GB Llama 3.3 70B bf16 na kartu, 4 nezávislé inferenčné silá
  • Viacmodelový RAG: čítačka + reranker + vision + embedder, všetko na jednom hostiteľovi

Cieľové pracovné zaťaženia

  • Backend pre inferenciu Frontier s otvorenou váhou — DeepSeek V3 Q3, Qwen3-Coder-480B Q3, GLM-5 Q3
  • Produkčná prevádzka multimodálnych agentov Llama 4 Maverick Q4 so štedrým kontextovým rozpočtom
  • Izolácia pre 4 nájomníkov na kartu – jedna Llama 3.3 70B bf16 na nájomníka, nulová krížová kontaminácia
  • FP8-natívne DeepSeek / R1 / Hunyuan slúžiace na kremíku Blackwell
  • Mistral Large 3 Q3 ako alternatíva k otvorenému lietadlu Western Apache-2.0 Frontier

Publikované referencie výkonnosti

Externé referencie | Nemerané na hardvéri Kentino

mierka Výsledok
RTX Pro 6000 na kartu INT8 TOPS 2 000 TOPOV
Šírka pásma pamäte RTX Pro 6000 ~1 800 GB/s na kartu
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (jednoduchý) ~30-40 tok/s
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (dávka-8) ~200 tok/s agregát
SGLang — Llama 4 Maverick Q4 na 4x Blackwell (single) ~45-55 tok/s
llama.cpp — Qwen3-Coder-480B Q3 na 4x Blackwell (jednoduchý) ~18-25 tok/s
FLUX.1 [dev] fp8 na jednej grafickej karte RTX Pro 6000 ~1.8 s na obrázok s rozlíšením 1024x1024

Kentino zverejní čísla od prvej strany po prvotnej zákazníckej zostave.

Nie ideálne pre

  • Záťaž pre jedného používateľa až do 70B – 4x RTX 5090 je podstatne lacnejšia pre 128 GB pool, ak nie je potrebná ECC a pasívna spoľahlivosť
  • Tiché nasadenie v blízkosti laboratória / kancelárie – pasívny chladič vyžaduje správne prúdenie vzduchu v dátovom centre spredu dozadu. Pre miesta citlivé na hluk zvoľte variant s turboventilátorom Max-Q (K-AI 384 Rome RTXPro6000MQ)
  • Školenie Frontier od začiatku (bez NVLink)
  • Plná pamäť DeepSeek V3 Q4 na karte (~404 GB) – možnosť upgradu na 6x RTX Pro 6000 / 576 GB

Záruka a dodacia lehota

3 rokov
Záruka na grafickú kartu NVIDIA OEM
2 rokov
záruka na diely
1 rok
záruka na prácu
10-28 dni
Čas prípravy

Zostavenie zahŕňa montáž, konfiguráciu BIOSu, inštaláciu ovládačov, naprogramovanie, testovanie pamäte a overenie funkčnosti. Dodacia lehota závisí od dostupnosti komponentov, ktorá sa potvrdí pri objednávke.

Odporúčané doplnky

  • Rozšírte pamäť RAM na 512 GB DDR4 (pridajte 2x 64 GB — 2 voľné sloty DIMM) pre väčší priestor na RAM v procesoroch Q3 Frontier Quantum
  • 4 TB NVMe Gen4 x4 pre knižnicu Frontier-Model (samotná DeepSeek V3 Q3 má na disku ~290 GB)
  • Kompletná 24U racková skriňa so spravovaným PDU a online UPS
  • Alternatívna silueta: variant s turboventilátorom Max-Q (K-AI 384 Rome RTXPro6000MQ) – rovnaký kremíkový chladič s tichším ventilátorom, pre laboratórne nasadenie
Покажи пълните подробности