Прескочи към информацията за продукта
1 od 7

Kentino sro

K-AI 192 Turín2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turín SP5

K-AI 192 Turín2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turín SP5

Обичайна цена EUR € 56.600,00
Обичайна цена Цена при разпродажба EUR € 56.600,00
zľava Изчерпано
С включени данъци. Доставката се изчислява при плащане.

K-AI 192 Turin2U RTXPro6000 4000TOPS

192 GB ECC Blackwell Flagship Pair
2x RTX Pro 6000 Server Edition | EPYC Turin SP5 | 4 000 TOPS INT8

4 000
INT8 VRCHY
192 GB
ECC VRAM
Blackwell
natívny FP8
2-karta
minimálny TP

Dve pasívne grafické karty RTX Pro 6000 Blackwell Server Edition – každá s 96 GB ECC. Nižšia réžia tenzorového paralelného spracovania ako pri zostavách so 4 alebo 8 kartami. Vlajková loď pre dátové centrá na platforme Gen5/DDR5 2U so skutočne redundantným napájaním 1+1.

2U rackový inferenčný server s dvoma pasívnymi kartami RTX Pro 6000 Blackwell Server Edition (96 GB ECC GDDR7 na kartu), jedným procesorom AMD EPYC 9335 Turin (32C/64T, 3.0/4.4 GHz), 512 GB DDR5-4800 ECC, 5.76 TB dátovej Gen5 NVMe a redundantným 1+1 napájacím zdrojom 80+ Platinum CRPS s výkonom 2.7 kW. Od 56 600 € bez DPH. Pre 70B hustý bf16 a stredne veľký MoE je menej veľkých kariet lepších ako viac malých kariet – tenzorový paralelizmus dvoch kariet má minimálnu komunikačnú réžiu a každá 96 GB karta obsahuje kompletnú kópiu väčšiny modelov.

Rovnaký pár 192 GB Blackwell ako v našej 4U Rome zostave, v 2U rackovo hustej ASRock šasi s plnou hostiteľskou pamäťou Gen5, pamäťou DDR5-4800 a originálnym 1+1 redundantným 2.7 kW Platinum CRPS napájacím zdrojom. Vyberte si túto zostavu, keď je dôležitá hustota racku, keď váš grant alebo špecifikácia obstarávania vyžadujú modernú platformu PCIe 5.0 / DDR5 alebo keď je redundantné napájanie požiadavkou a nie len doplnkovou ponukou.

technické vybavenie

Zložka detail
GPU 2x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC GDDR7 (pasívna, 600 W, PCIe 5.0 x16, dvojslotová)
fond VRAM 192 GB ECC (96 GB x 2) -- každá karta pojme samostatný model 70B bf16
CPU AMD EPYC 9335 Turin (32C/64T, 3.0/4.4 GHz, 210 W, SP5, 128x PCIe 5.0 linky, Zen5c, 256 MB L3)
Základná doska ASRock Rack 2U4G-GENOA/M3 (SP5, 4x PCIe 5.0 x16 dvojslotová grafická karta, 8x DDR5 1DPC, OCP 3.0, IPMI AST2600)
Systémová RAM 512 GB DDR5-4800 ECC RDIMM (8x 64 GB, 1DPC plne osadený -- konfigurácia s maximálnou šírkou pásma)
Bootovanie / úložisko Kioxia CD8-P 3.84 TB Gen5 U.3 (horúca vrstva, 1 DWPD, ~12 GB/s čítanie) + Kioxia CD8-P 1.92 TB Gen5 U.3 (bootovacia vrstva OS) -- 5.76 TB celkovo dátové centrum Gen5 NVMe
Zdroj 1+1 redundantný 2.7 kW 80+ Platinum CRPS (2x 1350 W pri 230 V) -- skutočná redundancia N+1; jeden zdroj udrží plnú inferenčnú záťaž
Podvozok 2U rackový modul s prúdením vzduchu smerom spredu dozadu (80 mm ventilátory s vysokým statickým tlakom). Možnosť nepretržitej prevádzky 24 hodín denne, 7 dní v týždni.
Chladenie Aktívny chladič CPU SP5 + 3x 80x38 mm predný prívod vzduchu + 1x 80x80 mm zadný výfuk (navrhnutý pre 4x pasívne tepelné zaťaženie GPU; rozloženie s 2 kartami poskytuje dostatočný tepelný priestor)
sieť Duálny slot Intel X710-T2L PCIe 10GBASE-T + OCP 3.0 k dispozícii pre upgrade 25/100 GbE

Napájacia obálka

  • Spotreba GPU: 2x 600 W = 1 200 W
  • Celkový výkon systému pri plnom zaťažení: ~1 510 W
  • Konfigurácia zdroja: 1+1 redundantný zdroj CRPS, 2x 1350 W pri 230 V (spolu 2 700 W)
  • Svetlá výška: 44.1 % pri typickom inferenčnom zaťažení
  • Skutočná redundancia N+1 – jeden zdroj udrží plnú inferenčnú záťaž; žiadne riziko zlyhania jedného zdroja

Topológia jazdných pruhov

PCIe Gen5 x16 end-to-end -- natívne pre hostiteľa aj kartu Gen5. Priame pripojenie root-complex, bez prepínača PCIe. K dispozícii zostáva jeden slot PCIe 5.0 x16 + jeden slot PCIe 5.0 x8 (NIC obsadzuje slot x8). Žiadne NVLink -- peer-to-peer pripojenie medzi GPU cez PCIe. Šírka pásma Gen5 eliminuje obmedzenie hostiteľa Gen4, ktoré je prítomné v 4U Rome súrodencovi.

Čo môžete spustiť

So 192 GB ECC VRAM na iba dvoch kartách Blackwell s natívnym FP8/FP4 je to najčistejšia cesta k hustým 70B streamom pri bf16 a stredne veľkým MoE. Dva nezávislé 70B streamy – jeden na kartu – alebo 200B MoE v oboch s minimálnou réžiou obojsmerného TP.

LLM -- text / uvažovanie / kódovanie

Čínska hranica

  • Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) pohodlný s dlhým ctx (~15-25 tok/s jeden stream naprieč 2 kartami); Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-122B-A10B fp8 (~75 GB); Qwen3-32B hustý bf16 s obrovským KV; QwQ-32B bf16
  • DeepSeek: DeepSeek-V3/R1 Q2 (~215 GB s malým prebytkom RAM) -- Blackwell natívne spúšťa FP8; DeepSeek-R2 32B bf16 dva súbežné streamy (jeden na kartu)
  • GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) -- konfigurácia pre hrdinu na tejto úrovni; GLM-4.5-Air FP8 alebo BF16 s obrovským KV
  • Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB) -- 389B MoE s 256k ctx; Hunyuan-A13B fp8 natívny (~80 GB) s obrovským KV
  • Ostatné: Baidu ERNIE-4.5-424B Q3 ​​(~180 GB); InternVL3.5-241B-A28B Q4 (~135 GB); MiniMax-M1 Q3 (~180 GB)

Západná hranica

  • Meta lama: Llama 3.3 70B bf16 na jednej karte -- dva nezávislé súbežné 70B streamy (~20-30 tok/s na stream); Llama 4 Scout bf16 (~218 GB, málo miesta); Llama 4 Maverick Q3 (~188 GB)
  • Mistral: Mistral Large 2 / Pixtral Large / Devstral 2 123B Q6 (~88 GB) jedna karta alebo bf16 v oboch; Mistral Small 3 viacero streamov
  • OpenAI (otvorené váhy): gpt-oss-120b MXFP4 natívny (80 GB) -- zmestí sa na JEDNU kartu, dva nezávislé súbežné streamy
  • NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~147 GB); Super 49B bf16 na jednej karte
  • Ostatné: Cohere Command R+ 104B Q6 (~85 GB) na jednej karte; Google Gemma 3 27B bf16 viacero súbežných streamov

Modely vizuálno-jazykového vnímania

InternVL3.5-241B-A28B Q4 (~135 GB); Qwen3-VL-235B-A22B Q4; Qwen3-VL-32B bf16 jedna karta; Pixtral Large 124B bf16 alebo Q6; Llama 3.2 90B Vision bf16 (~180 GB); Molmo 72B bf16 (~144 GB); GLM-4.6V 106B fp8; Gemma 3 27B multimodálny x 2-3 súbežné streamy.

Generovanie obrazu

FLUX.1 [dev] bf16 viacero súbežných streamov; FLUX.1 Kontext [dev]; FLUX Tools; SD 3.5 Large bf16 súbežné; HunyuanImage-2.1 bf16 (~34 GB) x 2-4 súbežné; HunyuanImage-3.0 base (80B MoE, 13B aktívne) bf16 -- zmestí sa na jednu kartu; HunyuanDiT; Kolors / Kolors 2.0; AuraFlow; OmniGen v1; PixArt-Sigma.

Generovanie videa

Wan 2.2 MoE duálny expert bf16 plný kontext -- zmestí sa na jednu kartu, dva súbežné generačné streamy; Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16 oba experty; HunyuanVideo 1.5; CogVideoX-5B bf16; Open-Sora 2.0 11B bf16; Mochi-1 bf16 (~42 GB); LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.

Zvuk / Reč / TTS

  • ASR: Whisper v3 veľký / turbo (~50x v reálnom čase); Parakeet-TDT; Canary 1B; Qwen3-ASR; SenseVoice
  • TTS: CosyVoice 2/3; Kokoro 82M; XTTS v2; Stabilný zvuk otvorený; Step-Audio-EditX
  • V reálnom čase / S2S: Kyutai Moshi 7B; Step-Audio 2 mini/R1; Qwen2.5-Omni-7B
  • Hudba / Zvukové efekty: MusicGen / AudioGen / Bark; SeamlessM4T v2

Poskytovanie viacerých modelov / viacerých nájomníkov

  • Dva nezávislé 70B streamy – jeden na kartu, najjednoduchšia forma izolácie nájomníka
  • Hustý 70B bf16 + podporný zásobník -- LLM na karte 1, obraz/video/audio na karte 2
  • 200B MoE naprieč oboma kartami -- minimálna réžia tenzorovo-paralelného prepojenia (obojsmerné rozdelenie)
  • fp8-native frontier -- rodina DeepSeek V3, Hunyuan-Large fp8 s Blackwellovými natívnymi cestami

Cieľové pracovné zaťaženia

  • Hustá inferencia 70B bf16 -- dve karty tenzorovo paralelné s minimálnou réžiou alebo jeden model na kartu pre streamovanie
  • 100-150B MoE v Q4-Q6 (GLM-4.5-Air, Qwen3.5-122B-A10B, Hunyuan-A13B, Llama 4 Scout)
  • FP8-natívna hraničná inferencia (rodina DeepSeek V3, Hunyuan, Llama 4) -- Blackwell spúšťa FP8 natívne
  • Vedecké výpočty vyžadujúce priepustnosť NVMe Gen5 a pamäť ECC na úrovni dátových centier
  • Štúdio pre generovanie obrazu a videa v bf16 (Wan 2.2 T2V-A14B, HunyuanVideo 13B, FLUX.1 [dev])
  • Nasadenia s obmedzenou hustotou rackov -- tvarový faktor 2U vs. ekvivalent 4U Rome pri rovnakej VRAM
  • Špecifikácie obstarávania vyžadujúce platformu PCIe 5.0 / DDR5 alebo redundantný zdroj PSU

Meraný výkon

Publikované referencie | Technický list NVIDIA RTX Pro 6000 Blackwell Server Edition + benchmarky komunity

mierka Výsledok
INT8 TOPS na kartu (údajový list NVIDIA) 2 000 TOPOV
Agregát INT8 TOPS (2 karty) 4 000 TOPOV
Šírka pásma pamäte na kartu ~1 800 GB/s, 96 GB ECC GDDR7
Llama 3.3 70B bf16 na kartu (komunitný model) 15 – 25 tokov/s pre jeden stream, 60 – 90 tokov/s pre dávku – očakávané zlepšenie oproti pamäťovej ceste na strane hostiteľa Gen5 pri streamovaní dávkových úloh v porovnaní s hostiteľom Gen4
Výhoda hostiteľa Gen5 (jedna karta s rovnakým kremíkom) Komplexné rozhranie PCIe 5.0 x16 znižuje latenciu prenosu medzi hostiteľským zariadením a zariadením pri streamovaní dávkových úloh; úlohy viazané na výpočty na karte dosahujú rovnakú priepustnosť ako zostavy hostované na Gen4.
Dvojkartový tenzorovo-paralelný 70B (komunitný) Očakáva sa ~30-45 tok/s v jednom prúde
Blackwell FP8 natívny DeepSeek-V3 fp8, Hunyuan-A13B fp8 bežia bez prenosu bf16

Zverejnené externé referencie, nemerané na hardvéri Kentino. Kentino zverejní čísla od prvej strany po prvej zákazníckej zostave.

Nie ideálne pre

  • Veľmi vysoká súbežnosť s viacerými nájomníkmi -- 4x L40 alebo 6x L4 sa lepšie rozdeľuje medzi viacero kariet
  • Silná KV vyrovnávacia pamäť pri veľmi dlhom kontexte -- prechod na K-AI 576 Genoa RTXPro6000 12000TOPS
  • Školenie -- Kentino nepredáva látky NVLink triedy H
  • Odhad rozpočtu pre tento pool VRAM -- zostava 4U Rome K-AI 192 RTXPro6000 4000TOPS je lacnejšia, ak je hostiteľská strana Gen4 prijateľná a nie je potrebná redundancia zdroja.

Záruka a dodacia lehota

2 rokov
záruka na diely
1 rok
záruka na prácu
14-21 dni
Čas prípravy

3-ročná záruka NVIDIA OEM na RTX Pro 6000 Server Edition + 36-mesačná záruka na šasi + záruka na integráciu Kentino. Zostavenie zahŕňa montáž, konfiguráciu BIOSu/firmvéru, nastavenie IPMI, inštaláciu ovládačov, záťažové testovanie a overenie funkčnosti. Dodacia lehota 14 – 21 pracovných dní sa vzťahuje na objednávku predajcu komponentov triedy Turin; potvrdené pri zadaní objednávky.

Odporúčané doplnky

  • Rozšírenie na konfiguráciu so 4 kartami -- šasi má natívne 4 pozície pre GPU (aktuálna zostava používa 2 zo 4), možnosť upgradu na K-AI 384 Turin2U RTXPro6000 8000TOPS
  • Pridajte 25 GbE alebo 100 GbE cez slot OCP 3.0 (variant Mellanox ConnectX-5/6 OCP)
  • Ďalšie disky Kioxia CD8-P NVMe v 2 zostávajúcich pozíciách U.2 pre RAID alebo scratch storage
  • Pre vyššiu výdrž (3 DWPD) vylepšite úložnú úroveň na Samsung PM1743 alebo Kioxia CM7-V
  • 24U rack skriňa + online UPS 5 kVA
Покажи пълните подробности