Kentino sro
K-AI 192 Rím ArcProB70 bude oznámené — 6× Intel Arc Pro B70 — EPYC Miláno (predobjednávka)
K-AI 192 Rím ArcProB70 bude oznámené — 6× Intel Arc Pro B70 — EPYC Miláno (predobjednávka)
Не може да се зареди възможността за взимане
V PRÍPRAVE
Predobjednávka — Cieľové dodanie Intel Arc Pro B70 je 3. štvrťrok 2026
K-AI 192 Rím ArcProB70 bude oznámené
192 GB VRAM Intel Xe2 Inference Server
6x Arc Pro B70 | EPYC Miláno | TOPY budú upresnené
Cenovo orientovaná zostava s vysokým objemom VRAM zameraná na open-source inferenčný stack od Intelu. Cena je viazaná na dostupnosť od Intelu.
4U rackový inferenčný server so šiestimi kartami Intel Arc Pro B70 Creator (každá s kapacitou 32 GB Xe2-HPG "Battlemage", spolu 192 GB), jedným procesorom AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4 ECC, 2 TB NVMe bootovaním a 2 kW ATX zdrojom (dôrazne sa odporúča upgrade na dva zdroje). Vytvorený pre softvérový ekosystém Intel: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL backend a vLLM-Intel forky. Záťaže iba s CUDA nebežia na tomto hardvéri.
technické vybavenie
| Zložka | detail |
|---|---|
| GPU | 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dvojslotové) |
| fond VRAM | 192 GB agregát na 6 kartách (bez medzikartovej štruktúry – peer prevádzka cez PCIe) |
| CPU | AMD EPYC 7643 Milan (48C/96T, 225 W, 128 liniek PCIe 4.0) |
| Základná doska | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| Systémová RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB) |
| Bootovanie / úložisko | 2 TB NVMe M.2 (PCIe 4.0 x4) |
| Zdroj | 1x 2 kW ATX zdroj (dôrazne sa odporúča duálny 2 kW synchronizovaný upgrade) |
| Podvozok | Montáž do racku 4U (6-slotové rozloženie) |
| Chladenie | Vežový chladič SP3 (Arctic Freezer 4U-M) + smerové prúdenie vzduchu spredu dozadu (priemyselné ventilátory) |
| sieť | Duálny 10 GbE integrovaný (Intel X550) |
Napájacia obálka
- Spotreba GPU: 6 x 250 W = 1 500 W (TDP publikované spoločnosťou Intel)
- Celkový výkon systému pri plnom zaťažení: ~1 825 W
- Celkový výkon zdroja: 2 000 W (jeden) — iba 8.75 % priestoru pre hlavu
- Dôrazne sa odporúča duálna synchronizácia s výkonom 2 kW – obnovuje ~45 % priestoru pre výšku
Topológia jazdných pruhov
ROMED8-2T poskytuje 7 liniek PCIe 4.0 x16. Šesť obsadených slotov; jeden voľný pre upsell sieťovej karty. Arc Pro B70 je natívny PCIe Gen5; ROMED8-2T beží na Gen4 – vplyv na šírku pásma je zanedbateľný pre inferenciu pri 32 GB na kartu. Žiadny prepínač PCIe. Žiadny ekvivalent Xe-Link.
Čo môžete spustiť
Všetky tvrdenia o kompatibilite sú cesty softvérového stacku Intel (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). Záťaže iba s technológiou CUDA nebežia na tomto hardvéri. Všetky údaje citujú publikované externé zdroje a podliehajú nezávislému overeniu pri dodaní kariet.
LLM – text / uvažovanie / kódovanie
Čínska hranica
- Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) s dlhým kontextovým headroom; Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — vhodné pre stredne silné kv
- Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB), ak je v ovládači odhalená cesta Xe2 fp8
- Ostatné: Baidu ERNIE-4.5-424B Q3 (~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6 súbežných streamov)
Západná hranica
- Meta lama: Llama 3.3 70B Q6-Q8 s veľkorysým KV; Llama 4 Scout 109B/17B Q4 (~63 GB) pohodlná
- Mistral: Mistral Malý 3 / Magistral Malý / Devstral Malý 2 (24B) na bf16; Pixtral Veľký Q4-Q6
- OpenAI (otvorené váhy): gpt-oss-120b MXFP4 natívny (~80 GB) — ak je v Intel stacku k dispozícii dostatočné množstvo MXFP4
- NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
- Ostatné: Gemma 3 27B bf16 multimodálny; Phi-4 / Phi-4-reasoning 14B; Cohere Command R+ 104B Q4
Modely vizuálno-jazykového vnímania
Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 až 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodálny; MiniCPM-V 2.6 / MiniCPM-o 2.6. Intel OpenVINO má silnú podporu pre vision-tower – VLM je pravdepodobnou silnou stránkou hneď od prvého dňa.
Generovanie obrazu
FLUX.1 [dev] / [schnell] fp8 alebo Q4 GGUF cez lama.cpp SYCL; SDXL / SD 3.5 Large cez OpenVINO genAI runtime; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); Kolors 2.0; AuraFlow; OmniGen; PixArt-Sigma.
Generovanie videa
Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video je dnes najslabšou cestou od Intelu – v čase dodania sa očakáva funkčnosť, ale nie optimálna priepustnosť.
Zvuk / Reč / TTS
- ASR: Whisper v3 large / turbo cez OpenVINO (prvotriedna podpora Intel Whisper); Parakeet-TDT; Canary; SenseVoice
- TTS: CosyVoice 2/3; Kokoro 82M; Stable Audio Open; XTTS v2; StyleTTS 2; Step-Audio-EditX
- V reálnom čase / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2
Poskytovanie viacerých modelov / viacerých nájomníkov
- 6 súbežných streamov modelu Q4 s kapacitou 32 GB (jeden na kartu) – napr. 6 agentov Qwen3-32B Q4
- Embeddingová flotila vo veľkom meradle — 6 paralelných streamov BGE-M3 / E5 / Nomic Embed (optimalizované pre OpenVINO)
- Zmiešaná rezidencia — 70B Q4 (tenzorovo-paralelné hranie na 3 kartách) + FLUX.1 (1 karta) + Whisper-turbo (1 karta) + Moshi (1 karta)
Cieľové pracovné zaťaženia
- Pilotný projekt hodnotenia softvéru Intel pre alternatívne LLM služby CUDA
- Vkladanie / preraďovanie backendu, kde VRAM-per-EUR dominuje požiadavkám na priepustnosť
- Inferencia rozpočtu za 4. štvrťrok – hranica rozpočtu – ministerstvo hospodárstva (Qwen3-235B, GLM-4.5/4.6/4.7) pre malé interné vývojové tímy
- Nasadenie natívneho modelu OpenVINO popri existujúcich procesoroch Intel Xeon / Arc Pro
- VLM / OCR / backend na spracovanie dokumentov (sila Intel OpenVINO)
Meraný výkon
Špecifikácie zverejnené spoločnosťou Intel | Podliehajú nezávislému overeniu pri dodaní kariet
| spec | Hodnota |
|---|---|
| VRAM na kartu | 32 CZ GDDR6 |
| Trieda šírky pásma pamäte | ~450 GB/s na kartu |
| Rozšírenia matice Xe (XMX) | Zrýchlené cez OpenVINO / IPEX-LLM |
| cesta FP8 | Kremík Xe2 – overenie expozície vodiča počas plavby |
Žiadne namerané údaje od spoločnosti Kentino. Špecifikácie zverejnené spoločnosťou Intel podliehajú nezávislému overeniu. Spoločnosť Kentino zverejní údaje o toku dát / QPS / šírke pásma od prvej strany hneď, ako prvá jednotka prejde testovaním.
Nie ideálne pre
- CUDA-natívne pracovné zaťaženia – žiadny CUDA na Inteli, očakávajte migračné problémy
- Nasadenia kritické pre produkciu v rámci SLA, kým sa nestabilizujú dodávky a nástroje Intel Arc Pro
- Frontier 600B+ MoE v 4. štvrťroku+ (vyžaduje 6x RTX Pro 6000 / 576 GB fond)
- Tréningové zaťaženie – Arc Pro je zameraný predovšetkým na inferenciu, zrelosť frameworku pre distribuované školenie je obmedzená
- Zákazníci, ktorí pred nákupom požadujú namerané benchmarky – táto skladová jednotka je na predobjednávku
Záruka a dodacia lehota
Štandardná záruka Kentino (2 roky na súčiastky, 1 rok na prácu); distribučné podmienky spoločnosti Intel majú prednosť tam, kde sú prísnejšie. Zostavenie zahŕňa montáž, konfiguráciu BIOSu, inštaláciu ovládačov, záťažové testovanie a overenie funkčnosti. Rezervujte si čas doručenia prvej vlny prostredníctvom kontaktného formulára Kentino. 30-dňová záruka na dohodnutie ceny pri objednávke.
Odporúčané doplnky
- Vylepšenie o dva synchronizované zdroje s výkonom 2 kW (výška zdroja pre jeden zdroj je obmedzená pri odbere 1 825 W – dôrazne sa odporúča)
- Rozšírenie pamäte RAM na 512 GB DDR4 (2x 64 GB — dva voľné sloty)
- 4 TB NVMe sekundárny disk pre knižnicu modelov
zdieľam
