Kentino sro
K-AI 192 Turín2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turín SP5
K-AI 192 Turín2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turín SP5
Не може да се зареди възможността за взимане
K-AI 192 Turin2U RTXPro6000 4000TOPS
192 GB ECC Blackwell Flagship Pair
2x RTX Pro 6000 Server Edition | EPYC Turin SP5 | 4 000 TOPS INT8
Dve pasívne grafické karty RTX Pro 6000 Blackwell Server Edition – každá s 96 GB ECC. Nižšia réžia tenzorového paralelného spracovania ako pri zostavách so 4 alebo 8 kartami. Vlajková loď pre dátové centrá na platforme Gen5/DDR5 2U so skutočne redundantným napájaním 1+1.
2U rackový inferenčný server s dvoma pasívnymi kartami RTX Pro 6000 Blackwell Server Edition (96 GB ECC GDDR7 na kartu), jedným procesorom AMD EPYC 9335 Turin (32C/64T, 3.0/4.4 GHz), 512 GB DDR5-4800 ECC, 5.76 TB dátovej Gen5 NVMe a redundantným 1+1 napájacím zdrojom 80+ Platinum CRPS s výkonom 2.7 kW. Od 56 600 € bez DPH. Pre 70B hustý bf16 a stredne veľký MoE je menej veľkých kariet lepších ako viac malých kariet – tenzorový paralelizmus dvoch kariet má minimálnu komunikačnú réžiu a každá 96 GB karta obsahuje kompletnú kópiu väčšiny modelov.
Rovnaký pár 192 GB Blackwell ako v našej 4U Rome zostave, v 2U rackovo hustej ASRock šasi s plnou hostiteľskou pamäťou Gen5, pamäťou DDR5-4800 a originálnym 1+1 redundantným 2.7 kW Platinum CRPS napájacím zdrojom. Vyberte si túto zostavu, keď je dôležitá hustota racku, keď váš grant alebo špecifikácia obstarávania vyžadujú modernú platformu PCIe 5.0 / DDR5 alebo keď je redundantné napájanie požiadavkou a nie len doplnkovou ponukou.
technické vybavenie
| Zložka | detail |
|---|---|
| GPU | 2x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC GDDR7 (pasívna, 600 W, PCIe 5.0 x16, dvojslotová) |
| fond VRAM | 192 GB ECC (96 GB x 2) -- každá karta pojme samostatný model 70B bf16 |
| CPU | AMD EPYC 9335 Turin (32C/64T, 3.0/4.4 GHz, 210 W, SP5, 128x PCIe 5.0 linky, Zen5c, 256 MB L3) |
| Základná doska | ASRock Rack 2U4G-GENOA/M3 (SP5, 4x PCIe 5.0 x16 dvojslotová grafická karta, 8x DDR5 1DPC, OCP 3.0, IPMI AST2600) |
| Systémová RAM | 512 GB DDR5-4800 ECC RDIMM (8x 64 GB, 1DPC plne osadený -- konfigurácia s maximálnou šírkou pásma) |
| Bootovanie / úložisko | Kioxia CD8-P 3.84 TB Gen5 U.3 (horúca vrstva, 1 DWPD, ~12 GB/s čítanie) + Kioxia CD8-P 1.92 TB Gen5 U.3 (bootovacia vrstva OS) -- 5.76 TB celkovo dátové centrum Gen5 NVMe |
| Zdroj | 1+1 redundantný 2.7 kW 80+ Platinum CRPS (2x 1350 W pri 230 V) -- skutočná redundancia N+1; jeden zdroj udrží plnú inferenčnú záťaž |
| Podvozok | 2U rackový modul s prúdením vzduchu smerom spredu dozadu (80 mm ventilátory s vysokým statickým tlakom). Možnosť nepretržitej prevádzky 24 hodín denne, 7 dní v týždni. |
| Chladenie | Aktívny chladič CPU SP5 + 3x 80x38 mm predný prívod vzduchu + 1x 80x80 mm zadný výfuk (navrhnutý pre 4x pasívne tepelné zaťaženie GPU; rozloženie s 2 kartami poskytuje dostatočný tepelný priestor) |
| sieť | Duálny slot Intel X710-T2L PCIe 10GBASE-T + OCP 3.0 k dispozícii pre upgrade 25/100 GbE |
Napájacia obálka
- Spotreba GPU: 2x 600 W = 1 200 W
- Celkový výkon systému pri plnom zaťažení: ~1 510 W
- Konfigurácia zdroja: 1+1 redundantný zdroj CRPS, 2x 1350 W pri 230 V (spolu 2 700 W)
- Svetlá výška: 44.1 % pri typickom inferenčnom zaťažení
- Skutočná redundancia N+1 – jeden zdroj udrží plnú inferenčnú záťaž; žiadne riziko zlyhania jedného zdroja
Topológia jazdných pruhov
PCIe Gen5 x16 end-to-end -- natívne pre hostiteľa aj kartu Gen5. Priame pripojenie root-complex, bez prepínača PCIe. K dispozícii zostáva jeden slot PCIe 5.0 x16 + jeden slot PCIe 5.0 x8 (NIC obsadzuje slot x8). Žiadne NVLink -- peer-to-peer pripojenie medzi GPU cez PCIe. Šírka pásma Gen5 eliminuje obmedzenie hostiteľa Gen4, ktoré je prítomné v 4U Rome súrodencovi.
Čo môžete spustiť
So 192 GB ECC VRAM na iba dvoch kartách Blackwell s natívnym FP8/FP4 je to najčistejšia cesta k hustým 70B streamom pri bf16 a stredne veľkým MoE. Dva nezávislé 70B streamy – jeden na kartu – alebo 200B MoE v oboch s minimálnou réžiou obojsmerného TP.
LLM -- text / uvažovanie / kódovanie
Čínska hranica
- Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) pohodlný s dlhým ctx (~15-25 tok/s jeden stream naprieč 2 kartami); Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-122B-A10B fp8 (~75 GB); Qwen3-32B hustý bf16 s obrovským KV; QwQ-32B bf16
- DeepSeek: DeepSeek-V3/R1 Q2 (~215 GB s malým prebytkom RAM) -- Blackwell natívne spúšťa FP8; DeepSeek-R2 32B bf16 dva súbežné streamy (jeden na kartu)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) -- konfigurácia pre hrdinu na tejto úrovni; GLM-4.5-Air FP8 alebo BF16 s obrovským KV
- Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB) -- 389B MoE s 256k ctx; Hunyuan-A13B fp8 natívny (~80 GB) s obrovským KV
- Ostatné: Baidu ERNIE-4.5-424B Q3 (~180 GB); InternVL3.5-241B-A28B Q4 (~135 GB); MiniMax-M1 Q3 (~180 GB)
Západná hranica
- Meta lama: Llama 3.3 70B bf16 na jednej karte -- dva nezávislé súbežné 70B streamy (~20-30 tok/s na stream); Llama 4 Scout bf16 (~218 GB, málo miesta); Llama 4 Maverick Q3 (~188 GB)
- Mistral: Mistral Large 2 / Pixtral Large / Devstral 2 123B Q6 (~88 GB) jedna karta alebo bf16 v oboch; Mistral Small 3 viacero streamov
- OpenAI (otvorené váhy): gpt-oss-120b MXFP4 natívny (80 GB) -- zmestí sa na JEDNU kartu, dva nezávislé súbežné streamy
- NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~147 GB); Super 49B bf16 na jednej karte
- Ostatné: Cohere Command R+ 104B Q6 (~85 GB) na jednej karte; Google Gemma 3 27B bf16 viacero súbežných streamov
Modely vizuálno-jazykového vnímania
InternVL3.5-241B-A28B Q4 (~135 GB); Qwen3-VL-235B-A22B Q4; Qwen3-VL-32B bf16 jedna karta; Pixtral Large 124B bf16 alebo Q6; Llama 3.2 90B Vision bf16 (~180 GB); Molmo 72B bf16 (~144 GB); GLM-4.6V 106B fp8; Gemma 3 27B multimodálny x 2-3 súbežné streamy.
Generovanie obrazu
FLUX.1 [dev] bf16 viacero súbežných streamov; FLUX.1 Kontext [dev]; FLUX Tools; SD 3.5 Large bf16 súbežné; HunyuanImage-2.1 bf16 (~34 GB) x 2-4 súbežné; HunyuanImage-3.0 base (80B MoE, 13B aktívne) bf16 -- zmestí sa na jednu kartu; HunyuanDiT; Kolors / Kolors 2.0; AuraFlow; OmniGen v1; PixArt-Sigma.
Generovanie videa
Wan 2.2 MoE duálny expert bf16 plný kontext -- zmestí sa na jednu kartu, dva súbežné generačné streamy; Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16 oba experty; HunyuanVideo 1.5; CogVideoX-5B bf16; Open-Sora 2.0 11B bf16; Mochi-1 bf16 (~42 GB); LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.
Zvuk / Reč / TTS
- ASR: Whisper v3 veľký / turbo (~50x v reálnom čase); Parakeet-TDT; Canary 1B; Qwen3-ASR; SenseVoice
- TTS: CosyVoice 2/3; Kokoro 82M; XTTS v2; Stabilný zvuk otvorený; Step-Audio-EditX
- V reálnom čase / S2S: Kyutai Moshi 7B; Step-Audio 2 mini/R1; Qwen2.5-Omni-7B
- Hudba / Zvukové efekty: MusicGen / AudioGen / Bark; SeamlessM4T v2
Poskytovanie viacerých modelov / viacerých nájomníkov
- Dva nezávislé 70B streamy – jeden na kartu, najjednoduchšia forma izolácie nájomníka
- Hustý 70B bf16 + podporný zásobník -- LLM na karte 1, obraz/video/audio na karte 2
- 200B MoE naprieč oboma kartami -- minimálna réžia tenzorovo-paralelného prepojenia (obojsmerné rozdelenie)
- fp8-native frontier -- rodina DeepSeek V3, Hunyuan-Large fp8 s Blackwellovými natívnymi cestami
Cieľové pracovné zaťaženia
- Hustá inferencia 70B bf16 -- dve karty tenzorovo paralelné s minimálnou réžiou alebo jeden model na kartu pre streamovanie
- 100-150B MoE v Q4-Q6 (GLM-4.5-Air, Qwen3.5-122B-A10B, Hunyuan-A13B, Llama 4 Scout)
- FP8-natívna hraničná inferencia (rodina DeepSeek V3, Hunyuan, Llama 4) -- Blackwell spúšťa FP8 natívne
- Vedecké výpočty vyžadujúce priepustnosť NVMe Gen5 a pamäť ECC na úrovni dátových centier
- Štúdio pre generovanie obrazu a videa v bf16 (Wan 2.2 T2V-A14B, HunyuanVideo 13B, FLUX.1 [dev])
- Nasadenia s obmedzenou hustotou rackov -- tvarový faktor 2U vs. ekvivalent 4U Rome pri rovnakej VRAM
- Špecifikácie obstarávania vyžadujúce platformu PCIe 5.0 / DDR5 alebo redundantný zdroj PSU
Meraný výkon
Publikované referencie | Technický list NVIDIA RTX Pro 6000 Blackwell Server Edition + benchmarky komunity
| mierka | Výsledok |
|---|---|
| INT8 TOPS na kartu (údajový list NVIDIA) | 2 000 TOPOV |
| Agregát INT8 TOPS (2 karty) | 4 000 TOPOV |
| Šírka pásma pamäte na kartu | ~1 800 GB/s, 96 GB ECC GDDR7 |
| Llama 3.3 70B bf16 na kartu (komunitný model) | 15 – 25 tokov/s pre jeden stream, 60 – 90 tokov/s pre dávku – očakávané zlepšenie oproti pamäťovej ceste na strane hostiteľa Gen5 pri streamovaní dávkových úloh v porovnaní s hostiteľom Gen4 |
| Výhoda hostiteľa Gen5 (jedna karta s rovnakým kremíkom) | Komplexné rozhranie PCIe 5.0 x16 znižuje latenciu prenosu medzi hostiteľským zariadením a zariadením pri streamovaní dávkových úloh; úlohy viazané na výpočty na karte dosahujú rovnakú priepustnosť ako zostavy hostované na Gen4. |
| Dvojkartový tenzorovo-paralelný 70B (komunitný) | Očakáva sa ~30-45 tok/s v jednom prúde |
| Blackwell FP8 natívny | DeepSeek-V3 fp8, Hunyuan-A13B fp8 bežia bez prenosu bf16 |
Zverejnené externé referencie, nemerané na hardvéri Kentino. Kentino zverejní čísla od prvej strany po prvej zákazníckej zostave.
Nie ideálne pre
- Veľmi vysoká súbežnosť s viacerými nájomníkmi -- 4x L40 alebo 6x L4 sa lepšie rozdeľuje medzi viacero kariet
- Silná KV vyrovnávacia pamäť pri veľmi dlhom kontexte -- prechod na K-AI 576 Genoa RTXPro6000 12000TOPS
- Školenie -- Kentino nepredáva látky NVLink triedy H
- Odhad rozpočtu pre tento pool VRAM -- zostava 4U Rome K-AI 192 RTXPro6000 4000TOPS je lacnejšia, ak je hostiteľská strana Gen4 prijateľná a nie je potrebná redundancia zdroja.
Záruka a dodacia lehota
3-ročná záruka NVIDIA OEM na RTX Pro 6000 Server Edition + 36-mesačná záruka na šasi + záruka na integráciu Kentino. Zostavenie zahŕňa montáž, konfiguráciu BIOSu/firmvéru, nastavenie IPMI, inštaláciu ovládačov, záťažové testovanie a overenie funkčnosti. Dodacia lehota 14 – 21 pracovných dní sa vzťahuje na objednávku predajcu komponentov triedy Turin; potvrdené pri zadaní objednávky.
Odporúčané doplnky
- Rozšírenie na konfiguráciu so 4 kartami -- šasi má natívne 4 pozície pre GPU (aktuálna zostava používa 2 zo 4), možnosť upgradu na K-AI 384 Turin2U RTXPro6000 8000TOPS
- Pridajte 25 GbE alebo 100 GbE cez slot OCP 3.0 (variant Mellanox ConnectX-5/6 OCP)
- Ďalšie disky Kioxia CD8-P NVMe v 2 zostávajúcich pozíciách U.2 pre RAID alebo scratch storage
- Pre vyššiu výdrž (3 DWPD) vylepšite úložnú úroveň na Samsung PM1743 alebo Kioxia CM7-V
- 24U rack skriňa + online UPS 5 kVA
zdieľam
