Kentino sro
K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)
K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)
Не може да се зареди възможността за взимане
K-AI 384 Rím RTXPro6000MQ 8000TOPS
Laboratórny server s 384 GB ECC VRAM
4x RTX Pro 6000 Max-Q Turbofan | EPYC Milan | 8 000 TOPS INT8
Publikované externé referencie. Nemerané na hardvéri Kentino.
Rackový inferenčný server s výškou 4U, štyrmi grafickými kartami NVIDIA RTX Pro 6000 Blackwell Max-Q s turboventilátorom (každá s kapacitou 96 GB ECC) spojenými s 384 GB ECC VRAM, jedným procesorom AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4-2666 ECC, 2 TB NVMe bootovaním a duálnym synchronizovaným 2.5 kW ATX zdrojom. Rovnaký kremík Blackwell ako v Server Edition – identická inferenčná obálka, identická priepustnosť – s tichším chladičom vhodným pre laboratórne, výskumné a vývojové prostredia a prostredia v blízkosti kancelárií.
technické vybavenie
| Zložka | detail |
|---|---|
| GPU | 4x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (chladič s turboventilátorom, 600 W TGP, PCIe 5.0 x16, 2000 INT8 TOPS/karta, natívna FP8) |
| fond VRAM | 384 GB agregovanej ECC pamäte na 4 kartách |
| CPU | AMD EPYC 7643 Milan (48C/96T, 225 W, 128 liniek PCIe 4.0) |
| Základná doska | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| Systémová RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB — 2 sloty DIMM voľné pre rozšírenie na 512 GB) |
| Bootovanie / úložisko | 2 TB NVMe M.2 (PCIe 4.0 x4) |
| Zdroj | 2x 2.5 kW ATX s synchronizačným káblom pre dva zdroje (agregát 5 kW) |
| Podvozok | 4U montáž do racku |
| Chladenie | Vežový chladič SP3 (trieda Arctic Freezer 4U-M) + smerované prúdenie vzduchu spredu dozadu (3x 120 mm predný vstup + 1x 120 mm zadný výstup). Grafické karty sa chladia samostatne pomocou turboventilátora (zadný výstup) – tichšie pre laboratórne prostredie. |
| sieť | Duálny 10 GbE integrovaný (Intel X550) |
Napájacia obálka
- Spotreba grafického procesora: 4 x 600 W = 2 400 W
- Celkový výkon systému pri plnom zaťažení: ~2 775 W
- Celkový výkon zdroja: 5 000 W (duálny synchronizovaný zdroj 2.5 kW) — 44.5 % rezerva
- Duálny zdroj PSU pre rozdelené napájanie – porucha jedného zdroja = strata 2 grafických kariet alebo 2 grafických kariet + základnej dosky
Tepelný profil (Max-Q)
Max-Q používa turboventilátorový (dúchadlový) chladič so smerovým výfukom zo zadnej strany karty. Očakávaná teplota GPU pri nepretržitom zaťažení je 72 – 80 °C. Výrazne tichšia ako pasívne karty v šasi s vysokým statickým tlakom. Lepšie sa hodí na prúdenie vzduchu mimo dátových centier, do otvoreného racku alebo do laboratória/kancelárie. Kremík, TDP, ECC a výkon sú identické s edíciou Server Edition.
Čo môžete spustiť
Identické s edíciou Server (K-AI 384 Rome RTXPro6000) – rovnaký kremík Blackwell, rovnaký 384 GB ECC pool, rovnaký natívny FP8, rovnaká kompatibilita s modelmi. Rozdiel je akustický, nie výpočtový.
LLM – text / uvažovanie / kódovanie
Čínska hranica
- DeepSeek V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 Q3 (~290 GB) pohodlne na karte (~30-40 tok/s jeden tok, publikovaná referencia); FP8 natívny (~670 GB s rezervou RAM)
- Qwen3-Coder-480B-A35B Q3 (~350 GB obmedzené s únikom RAM) — SOTA otvorený kódovací agent (~18-25 tok/s jeden, publikovaná referencia)
- Qwen3-235B-A22B Q6/Q8 (~200-280 GB) s dlhým ctx a dávkovým spracovaním pre viacerých používateľov
- GLM-5 / GLM-5.1 Q3 (~317 GB) – čínska hranica, kódovanie blízko verzie Claude Opus 4.6
- Kimi-K2 1.58-bitový UD (~240 GB) — agent s biliónmi parametrov pri skutočnej priepustnosti
- Hunyuan-Veľký 389B/52B Q4 (~220 GB), natívny FP8 (~390 GB úložisko)
- ERNIE-4.5-424B-A47B 4. štvrťrok (~240 GB); MiniMax-M1 4. štvrťrok (~260 GB) 1M-ctx
- Lama 3.3 70B bf16 rezidentné na jednej karte (96 GB/karta)
Západná hranica
- Mistral Large 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB) — otvorené váhy na hranici západnej pologule (~20-30 tok/s jednotlivo, publikovaná referencia)
- Flame 4 Maverick (400B/17B) Q4 (~232 GB) so štedrým rozpočtom KV (~45-55 tok/s jeden, publikovaná referencia)
- Llama-3.1-Nemotron Ultra 253B 4. – 6. štvrťrok (~119 – 207 GB)
- gpt-oss-120b Natívny MXFP4 (80 GB) so súbežnou pamäťovou rezervou
- Pixtral Large / Mistral Large 2 bf16 (~248 GB); Devstral 2 123B bf16 — 256k otvorené kódovanie
- Lama 3.3 70B bf16 na jednej karte; možné 4 súbežné nasadenia 70B
Modely vizuálno-jazykového vnímania
Qwen3-VL-235B-A22B bf16 (~240 GB); InternVL3.5-241B-A28B Q4 (~135 GB); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16; Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V 106B bf16 na TP. Blackwell fp8 poskytuje ~2x vyššiu priepustnosť pri inferencii Vision-Tower v porovnaní s Ada.
Generovanie obrazu
FLUX.1 [dev] / Kontext / Nástroje v natívnom režime FP8 (~15-20 s na obraz 1024x1024 na jednej RTX Pro 6000, publikovaná referencia); SD 3.5 Large; HunyuanImage-2.1 (17B natívne 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; 4x súbežné ComfyUI workery.
Generovanie videa
Wan 2.2 T2V-A14B / I2V-A14B duálny expert bf16; HunyuanVideo 13B bf16 obaja experti; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.
Zvuk / Reč / TTS
- ASR: Whisper v3 veľký / turbo; Parakeet-TDT; Canary; Qwen3-ASR; SenseVoice
- TTS: CosyVoice 2/3; Kokoro; Stable Audio Open; XTTS v2; Step-Audio-EditX
- V reálnom čase / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
- Hudba / Zvukové efekty: MusicGen / AudioGen / Bark / SeamlessM4T
Poskytovanie viacerých modelov / viacerých nájomníkov
- DeepSeek V3 Q3 + súbežný 70B + FLUX.1 + Whisper pre všetkých rezidentov
- 4-cestná tenzorovo paralelná trieda na 350-400B v 4. štvrťroku
- Izolácia nájomníka na kartu – jeden 96 GB Llama 3.3 70B bf16 na kartu, 4 nezávislé inferenčné silá
- Viacmodelový RAG: čítačka + reranker + vision + embedder, všetko na jednom hostiteľovi
Cieľové pracovné zaťaženia
- Inferencia Frontier Open-Way pre laboratórny/výskumný a vývojový tím, kde záleží na akustickom rozpočte
- Serverovňa pre malé tímy bez vyhradeného prúdenia vzduchu v dátovom centre – samochladenie Max-Q toleruje umiestnenie v otvorenom racku
- Pracovná stanica s umelou inteligenciou priľahlá kancelárskej budove pre špecializovaný tím (výskum strojového učenia, agentické nástroje)
- FP8-natívne poskytovanie (DeepSeek / R1 / Hunyuan) v laboratórnych podmienkach
- Izolačné zaťaženie pre 4 nájomcov na kartu s rozpočtom na šum
Publikované referencie výkonnosti
Externé referencie | Rovnaký kremík ako v Server Edition | Nemerané na hardvéri Kentino
| mierka | Výsledok |
|---|---|
| RTX Pro 6000 na kartu INT8 TOPS | 2 000 TOPOV |
| Šírka pásma pamäte RTX Pro 6000 | ~1 800 GB/s na kartu |
| vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (jednoduchý) | ~30-40 tok/s |
| vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (dávka-8) | ~200 tok/s agregát |
| SGLang — Llama 4 Maverick Q4 na 4x Blackwell (single) | ~45-55 tok/s |
| llama.cpp — Qwen3-Coder-480B Q3 na 4x Blackwell (jednoduchý) | ~18-25 tok/s |
| FLUX.1 [dev] fp8 na jednej grafickej karte RTX Pro 6000 | ~1.8 s na obrázok s rozlíšením 1024x1024 |
Kentino zverejní čísla od prvej strany po prvotnej zákazníckej zostave.
Nie ideálne pre
- Správne nasadenie rackov v dátových centrách so zavedeným prúdením vzduchu v horúcej uličke – namiesto toho zvoľte pasívnu Server Edition (K-AI 384 Rome RTXPro6000): rovnaký kremík, mechanicky jednoduchšie
- Záťaž pre jedného používateľa až do 70B (4x RTX 5090 je podstatne lacnejšia pre 128 GB pool)
- Školenie Frontier od začiatku (bez NVLink)
- Plná pamäť DeepSeek V3 Q4 na karte (~404 GB) – možnosť upgradu na 6x RTX Pro 6000 / 576 GB
Záruka a dodacia lehota
Zostavenie zahŕňa montáž, konfiguráciu BIOSu, inštaláciu ovládačov, naprogramovanie, testovanie pamäte a overenie funkčnosti. Dodacia lehota závisí od dostupnosti komponentov, ktorá sa potvrdí pri objednávke.
Odporúčané doplnky
- Rozšírte pamäť RAM na 512 GB DDR4 (pridajte 2x 64 GB — 2 voľné sloty DIMM) pre väčší priestor na RAM v procesoroch Q3 Frontier Quantum
- 4 TB NVMe Gen4 x4 pre knižnicu Frontier-Model (samotná DeepSeek V3 Q3 má na disku ~290 GB)
- Kompletná 24U racková skriňa so spravovaným PDU a online UPS
- Alternatívna silueta: pasívna Server Edition (K-AI 384 Rome RTXPro6000) – rovnaký kremík, pre nasadenie prúdenia vzduchu v dátových centrách
zdieľam
