Прескочи към информацията за продукта
1 od 7

Kentino sro

K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)

K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)

Обичайна цена EUR € 46.583,00
Обичайна цена Цена при разпродажба EUR € 46.583,00
zľava Изчерпано
С включени данъци. Доставката се изчислява при плащане.

K-AI 384 Rím RTXPro6000MQ 8000TOPS

Laboratórny server s 384 GB ECC VRAM
4x RTX Pro 6000 Max-Q Turbofan | EPYC Milan | 8 000 TOPS INT8

8 000
TOPS INT8
384 GB
fond ECC VRAM
fp8
Rodák z Blackwellu
Tichý
chladenie turbodúchadla

Publikované externé referencie. Nemerané na hardvéri Kentino.

Rackový inferenčný server s výškou 4U, štyrmi grafickými kartami NVIDIA RTX Pro 6000 Blackwell Max-Q s turboventilátorom (každá s kapacitou 96 GB ECC) spojenými s 384 GB ECC VRAM, jedným procesorom AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4-2666 ECC, 2 TB NVMe bootovaním a duálnym synchronizovaným 2.5 kW ATX zdrojom. Rovnaký kremík Blackwell ako v Server Edition – identická inferenčná obálka, identická priepustnosť – s tichším chladičom vhodným pre laboratórne, výskumné a vývojové prostredia a prostredia v blízkosti kancelárií.

technické vybavenie

Zložka detail
GPU 4x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (chladič s turboventilátorom, 600 W TGP, PCIe 5.0 x16, 2000 INT8 TOPS/karta, natívna FP8)
fond VRAM 384 GB agregovanej ECC pamäte na 4 kartách
CPU AMD EPYC 7643 Milan (48C/96T, 225 W, 128 liniek PCIe 4.0)
Základná doska ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
Systémová RAM 384 GB DDR4-2666 ECC RDIMM (6x 64 GB — 2 sloty DIMM voľné pre rozšírenie na 512 GB)
Bootovanie / úložisko 2 TB NVMe M.2 (PCIe 4.0 x4)
Zdroj 2x 2.5 kW ATX s synchronizačným káblom pre dva zdroje (agregát 5 kW)
Podvozok 4U montáž do racku
Chladenie Vežový chladič SP3 (trieda Arctic Freezer 4U-M) + smerované prúdenie vzduchu spredu dozadu (3x 120 mm predný vstup + 1x 120 mm zadný výstup). Grafické karty sa chladia samostatne pomocou turboventilátora (zadný výstup) – tichšie pre laboratórne prostredie.
sieť Duálny 10 GbE integrovaný (Intel X550)

Napájacia obálka

  • Spotreba grafického procesora: 4 x 600 W = 2 400 W
  • Celkový výkon systému pri plnom zaťažení: ~2 775 W
  • Celkový výkon zdroja: 5 000 W (duálny synchronizovaný zdroj 2.5 kW) — 44.5 % rezerva
  • Duálny zdroj PSU pre rozdelené napájanie – porucha jedného zdroja = strata 2 grafických kariet alebo 2 grafických kariet + základnej dosky

Tepelný profil (Max-Q)

Max-Q používa turboventilátorový (dúchadlový) chladič so smerovým výfukom zo zadnej strany karty. Očakávaná teplota GPU pri nepretržitom zaťažení je 72 – 80 °C. Výrazne tichšia ako pasívne karty v šasi s vysokým statickým tlakom. Lepšie sa hodí na prúdenie vzduchu mimo dátových centier, do otvoreného racku alebo do laboratória/kancelárie. Kremík, TDP, ECC a výkon sú identické s edíciou Server Edition.

Čo môžete spustiť

Identické s edíciou Server (K-AI 384 Rome RTXPro6000) – rovnaký kremík Blackwell, rovnaký 384 GB ECC pool, rovnaký natívny FP8, rovnaká kompatibilita s modelmi. Rozdiel je akustický, nie výpočtový.

LLM – text / uvažovanie / kódovanie

Čínska hranica

  • DeepSeek V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 Q3 (~290 GB) pohodlne na karte (~30-40 tok/s jeden tok, publikovaná referencia); FP8 natívny (~670 GB s rezervou RAM)
  • Qwen3-Coder-480B-A35B Q3 (~350 GB obmedzené s únikom RAM) — SOTA otvorený kódovací agent (~18-25 tok/s jeden, publikovaná referencia)
  • Qwen3-235B-A22B Q6/Q8 (~200-280 GB) s dlhým ctx a dávkovým spracovaním pre viacerých používateľov
  • GLM-5 / GLM-5.1 Q3 (~317 GB) – čínska hranica, kódovanie blízko verzie Claude Opus 4.6
  • Kimi-K2 1.58-bitový UD (~240 GB) — agent s biliónmi parametrov pri skutočnej priepustnosti
  • Hunyuan-Veľký 389B/52B Q4 (~220 GB), natívny FP8 (~390 GB úložisko)
  • ERNIE-4.5-424B-A47B 4. štvrťrok (~240 GB); MiniMax-M1 4. štvrťrok (~260 GB) 1M-ctx
  • Lama 3.3 70B bf16 rezidentné na jednej karte (96 GB/karta)

Západná hranica

  • Mistral Large 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB) — otvorené váhy na hranici západnej pologule (~20-30 tok/s jednotlivo, publikovaná referencia)
  • Flame 4 Maverick (400B/17B) Q4 (~232 GB) so štedrým rozpočtom KV (~45-55 tok/s jeden, publikovaná referencia)
  • Llama-3.1-Nemotron Ultra 253B 4. – 6. štvrťrok (~119 – 207 GB)
  • gpt-oss-120b Natívny MXFP4 (80 GB) so súbežnou pamäťovou rezervou
  • Pixtral Large / Mistral Large 2 bf16 (~248 GB); Devstral 2 123B bf16 — 256k otvorené kódovanie
  • Lama 3.3 70B bf16 na jednej karte; možné 4 súbežné nasadenia 70B

Modely vizuálno-jazykového vnímania

Qwen3-VL-235B-A22B bf16 (~240 GB); InternVL3.5-241B-A28B Q4 (~135 GB); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16; Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V 106B bf16 na TP. Blackwell fp8 poskytuje ~2x vyššiu priepustnosť pri inferencii Vision-Tower v porovnaní s Ada.

Generovanie obrazu

FLUX.1 [dev] / Kontext / Nástroje v natívnom režime FP8 (~15-20 s na obraz 1024x1024 na jednej RTX Pro 6000, publikovaná referencia); SD 3.5 Large; HunyuanImage-2.1 (17B natívne 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; 4x súbežné ComfyUI workery.

Generovanie videa

Wan 2.2 T2V-A14B / I2V-A14B duálny expert bf16; HunyuanVideo 13B bf16 obaja experti; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.

Zvuk / Reč / TTS

  • ASR: Whisper v3 veľký / turbo; Parakeet-TDT; Canary; Qwen3-ASR; SenseVoice
  • TTS: CosyVoice 2/3; Kokoro; Stable Audio Open; XTTS v2; Step-Audio-EditX
  • V reálnom čase / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
  • Hudba / Zvukové efekty: MusicGen / AudioGen / Bark / SeamlessM4T

Poskytovanie viacerých modelov / viacerých nájomníkov

  • DeepSeek V3 Q3 + súbežný 70B + FLUX.1 + Whisper pre všetkých rezidentov
  • 4-cestná tenzorovo paralelná trieda na 350-400B v 4. štvrťroku
  • Izolácia nájomníka na kartu – jeden 96 GB Llama 3.3 70B bf16 na kartu, 4 nezávislé inferenčné silá
  • Viacmodelový RAG: čítačka + reranker + vision + embedder, všetko na jednom hostiteľovi

Cieľové pracovné zaťaženia

  • Inferencia Frontier Open-Way pre laboratórny/výskumný a vývojový tím, kde záleží na akustickom rozpočte
  • Serverovňa pre malé tímy bez vyhradeného prúdenia vzduchu v dátovom centre – samochladenie Max-Q toleruje umiestnenie v otvorenom racku
  • Pracovná stanica s umelou inteligenciou priľahlá kancelárskej budove pre špecializovaný tím (výskum strojového učenia, agentické nástroje)
  • FP8-natívne poskytovanie (DeepSeek / R1 / Hunyuan) v laboratórnych podmienkach
  • Izolačné zaťaženie pre 4 nájomcov na kartu s rozpočtom na šum

Publikované referencie výkonnosti

Externé referencie | Rovnaký kremík ako v Server Edition | Nemerané na hardvéri Kentino

mierka Výsledok
RTX Pro 6000 na kartu INT8 TOPS 2 000 TOPOV
Šírka pásma pamäte RTX Pro 6000 ~1 800 GB/s na kartu
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (jednoduchý) ~30-40 tok/s
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (dávka-8) ~200 tok/s agregát
SGLang — Llama 4 Maverick Q4 na 4x Blackwell (single) ~45-55 tok/s
llama.cpp — Qwen3-Coder-480B Q3 na 4x Blackwell (jednoduchý) ~18-25 tok/s
FLUX.1 [dev] fp8 na jednej grafickej karte RTX Pro 6000 ~1.8 s na obrázok s rozlíšením 1024x1024

Kentino zverejní čísla od prvej strany po prvotnej zákazníckej zostave.

Nie ideálne pre

  • Správne nasadenie rackov v dátových centrách so zavedeným prúdením vzduchu v horúcej uličke – namiesto toho zvoľte pasívnu Server Edition (K-AI 384 Rome RTXPro6000): rovnaký kremík, mechanicky jednoduchšie
  • Záťaž pre jedného používateľa až do 70B (4x RTX 5090 je podstatne lacnejšia pre 128 GB pool)
  • Školenie Frontier od začiatku (bez NVLink)
  • Plná pamäť DeepSeek V3 Q4 na karte (~404 GB) – možnosť upgradu na 6x RTX Pro 6000 / 576 GB

Záruka a dodacia lehota

3 rokov
Záruka na grafickú kartu NVIDIA OEM
2 rokov
záruka na diely
1 rok
záruka na prácu
10-28 dni
Čas prípravy

Zostavenie zahŕňa montáž, konfiguráciu BIOSu, inštaláciu ovládačov, naprogramovanie, testovanie pamäte a overenie funkčnosti. Dodacia lehota závisí od dostupnosti komponentov, ktorá sa potvrdí pri objednávke.

Odporúčané doplnky

  • Rozšírte pamäť RAM na 512 GB DDR4 (pridajte 2x 64 GB — 2 voľné sloty DIMM) pre väčší priestor na RAM v procesoroch Q3 Frontier Quantum
  • 4 TB NVMe Gen4 x4 pre knižnicu Frontier-Model (samotná DeepSeek V3 Q3 má na disku ~290 GB)
  • Kompletná 24U racková skriňa so spravovaným PDU a online UPS
  • Alternatívna silueta: pasívna Server Edition (K-AI 384 Rome RTXPro6000) – rovnaký kremík, pre nasadenie prúdenia vzduchu v dátových centrách
Покажи пълните подробности