• <Läs mer på Intel.com
Masthead Light

Produktfamiljen Intel® Xeon Phi™

Effektiv parallell bearbetning för att ge kraft åt dina banbrytande innovationer

Banbrytande prestanda för dina effektiva parallella applikationer

Få mer kraft i dina banbrytande innovationer med den effektiva parallella bearbetningen i hjälpprocessorn Intel® Xeon Phi™.  Vi har packat in över en teraFLOPS med dubbel precisions topp-prestanda i varje chip — högsta parallella prestanda per watt av någon Intel® Xeon® processor.1,2,3,4  Nu kan du tänka "kunna använda igen" i stället för "behöva koda om" med x86-kompatibilitet. Språk, verktyg och applikationer körs smidigt över hela spektrum med Intel® Xeon® processorfamiljbaserade plattformar.

Intel® Xeon Phi™ hjälpprocessor:

En enda programmeringsmodell för all din kod

Ett brett ekosystem med programmeringsspråk, modeller och verktyg stödjer Intel® arkitekturen och de kan alla användas med både Intel Xeon-processorer och hjälpprocessorerna Intel Xeon Phi. Applikationer som körs på en processorfamilj kan även köras på den andra. Denna enhetlighet kan avsevärt reducera komplikationerna vid utveckling av programvara. Befintliga applikationer måste justeras och kompileras om för att maximera genomströmning, men dina utvecklare behöver inte tänka om hela problemet igen och behöver inte lära sig nya verktyg och programmeringsmodeller. Istället kan de återanvända befintlig kod och upprätthålla en gemensam kodbas som använder bekanta verktyg och metoder.

En hjälpprocessorfamilj för olika behov

Hjälpprocessorerna Intel Xeon Phi tillhandahåller upp till 61 kärnor, 244 trådar och prestanda på 1,2 teraflops, och finns i en rad olika konfigurationer för att ta itu med olika typer av maskinvara, programvara, arbetsbelastning, prestanda och effektivitetskrav.

Hjälpprocessorkortet Intel® Xeon Phi™

Hjälpprocessorfamiljen Intel® Xeon Phi™ 3100

Hjälpprocessorfamiljen Intel® Xeon Phi™ 3100 tillhandahåller enastående parallella prestanda. Den är ett utmärkt val för datorbundna arbetsbelastningar, exempelvis MonteCarlo, Black-Scholes, HPL, LifeSc och många andra.

Visa produktspecifikationer >

Hjälpprocessorkortet Intel® Xeon Phi™

Hjälpprocessorfamiljen Intel® Xeon Phi™ 5100

Hjälpprocessorfamiljen Intel® Xeon Phi™ 5100 är optimerad för databehandling med hög densitet och är väl anpassad för arbetsbelastningar som är bundna av minnesbandbredd, exempelvis STREAM, minneskapacitetsgräns, exempelvis ray-tracing, eller både och, exempelvis RTM (Reverse Time Migration).

Visa produktspecifikationer >

Hjälpprocessorkortet Intel® Xeon Phi™

Hjälpprocessorfamiljen Intel® Xeon Phi™ 7100

Hjälpprocessorfamiljen Intel® Xeon Phi™ 7100 tillhandahåller de flesta funktionerna och största prestanda och minneskapacitet som finns i produktfamiljen Intel Xeon Phi. Familjen stöder Intel® Turbo Boost-teknologi 1.0 som ökar kärnfrekvenser under toppbelastningar när temperaturförhållanden tillåter det.

Visa produktspecifikationer >

Hjälpprocessorkortet Intel® Xeon Phi™

Banbrytande prestanda

Få över en teraFLOPS med toppenprestanda och dubbelprecision.1,2,3

Jämfört med processorn Intel® Xeon® E5-familjebaserade servrar, levererar hjälpprocessorn Intel® Xeon Phi™:

  • Upp till 2,5 gånger större prestanda på effektiva parallella applikationer1,5,6
  • Upp till 3,2 gånger högre topp-FLOPS-beräkningar (floating-point operations per second)1,3,7
  • Upp till 2,2 gånger högre minnesbandbredd1,8
  • Upp till 10 gånger bättre prestanda på vissa applikationer för finanstjänster1,9
  • Upp till 4 gånger mer prestanda per watt1,4

Öka serverdensiteten med upp till 8x större FLOPS per rack genom att lägga till hjälpprocessorerna Intel® Xeon Phi™ i dina Intel® Xeon® processor E5 familjebaserade servrar.1,3,10

 

Hjälpprocessorkortet Intel® Xeon Phi™

Intel® arkitektur med enkel programmering

Applikationer kan stödja både processorerna Intel® Xeon® och hjälpprocessorerna Intel® Xeon Phi™ som använder vanliga språk, modeller och verktyg, inklusive:

  • Välbekanta och standardmässiga utvecklingsverktyg – inget behov att lära sig nya språk eller verktyg
  • Intel-verktyg som Intel® Cluster Studio XE, såväl som många verktyg från andra tillverkare
  • Populära tillvägagångssätt exempelvis Message Passing Interface, OpenMP, Fortrans DO CONCURRENT*, Intel® TBB (Intel® Threading Building Blocks) och Intel® Cilk™ Plus

Flexibel exekvering

Flexibla behandlingsmoduler

Utnyttja databehandlingsflexibiliteten i hjälpprocessorerna Intel® Xeon Phi™:

  • Använd i samband med Intel® Xeon® processorer för att accelerera bearbetning av effektiv parallell kod
  • Skapa oberoende högpresterande beräkningsnoder med hjälpprocessorn som kan ha sin egen IP-adress och köra applikationer fristående – till skillnad från en grundläggande accelerator

Produkt- och prestandainformation

open

1. Programvara och arbetsbelastningar som används i prestandatester kan ha optimerats för prestanda endast på mikroprocessorer från Intel. Prestandatester som SYSmark och MobileMark mäts med hjälp av särskilda datorsystem, -komponenter, -program, -åtgärder och -funktioner. Om någon av de här faktorerna ändras kan även utfallet av testet ändras. Du bör jämföra med annan information och andra prestandatest för att får en helt rättvisande bild inför köpet, inklusive prestandan för den tänkta produkten i kombination med andra produkter. Läs mer på www.intel.com/performance.

2. Anspråk baserat på beräknad teoretisk Peak Double-precision prestandakapacitet för en enda coprocessor. 16 DP FLOPS/klocka/kärna * 61 kärnor * 1,238 GHz = 1,208 TeraFLOPS.

3. Resultat har beräknats baserat på intern Intel-analys och tillhandahålls endast för informationsändamål. Skillnader i systemets maskinvaru- eller programvarudesign eller -konfiguration kan påverka faktiska prestanda.

4. 2 socket Intel® Xeon® processor E5-2670 server jämfört med en enkel Intel® Xeon Phi™ coprocessor 7120P (Intel-mätt DGEMM prestanda/watt poäng 309 GF/s vid 335W jämfört med 829 GF/s vid 195W).

5. 2 socket Intel® Xeon® processor E5-2600 produktfamiljserver jämfört med Intel® Xeon Phi™ coprocessor (2.52x: Mätt av Los Alamos Labs i juni 2012. 2 socket E5-2687 (8 kärnor, 3,1 GHz) jämfört med 1 förproduktion Intel® Xeon Phi™ coprocessor (60 kärnor, 1.0GHz) på Molecular Dynamics-applikation. Arbetsbelastingstid för slutförande som är 4 tim 7 min 10 sek jämfört med 1 tim 38 min 16 sek) (2,53x: Mätt av Sinopec oktober 2012. 2 socket E5-2680 (8 kärnor, 2,7 GHz) server utan coprocessor jämfört med samma server med 2 förproduktion Intel® Xeon Phi™ coprocessorer (61 kärnor, 1,091 GHz) på Seismic Imaging-applikation.  Arbetsbelastningstid för slutförande på 1342 sekunder jämfört med 528,6 sekunder).

6. Intel har ingen kontroll över och granskar inte utformningen eller implementeringen av tredje parts prestandatester eller de webbplatser som det refereras till i detta dokument Intel uppmanar alla sina kunder att besöka dessa eller andra webbplatser där liknande prestandatester redovisas och bekräfta att prestandatesterna stämmer och verkligen återspeglar prestanda för de system som finns på marknaden.

7. Beräknad teoretisk Peak Double-precision FLOPS (2 x Intel® Xeon® E5-2670 processor; 8C, 2,6 GHz jämfört med 1 x Intel® Xeon Phi™ coprocessor 7120P med 61C, 1,238 GHz).

8. 2 socket Intel® Xeon® E5-2600 processorproduktfamiljen server jämfört med Intel® Xeon Phi™ coprocessor (2,2x, mätt av Intel 2012-10. 2-socket Intel® Xeon® E5-2670 processor (8 kärnor, 2,6 GHz) jämfört med 1 Intel® Xeon Phi™ coprocessor 7120P (61 kärnor, 1,238 GHz) på STREAM Triad benchmark 79,5 GB/s jämfört med 175 GB/s).

9. 2 socket Intel® Xeon® processor E5-2600 produktfamiljserver jämfört med Intel® Xeon Phi™ coprocessor (10.75x: Mätt av Intel oktober 2012. 2 socket E5-2670 (8-kärnig, 2,6 GHz) jämfört med 1 Intel® Xeon Phi™ coprocessor SE10P (61 kärnor, 1,1 GHz) på en enkel precisions Monte Carlo-simulering.  45,501 optioner/sek jämfört med 489,354 optioner/sek)

10. (Phi FLOPS per rack) 2-socket Intel® Xeon® E5-2670-processor server jämfört med samma 2-socket server med 2 Intel® Xeon Phi™ coprocessor 7120P installerade (beräknad teoretisk Peak Dual-precision FLOPS: 332,8 GF/s jämfört med ( 332,8 +( 2 x 1208 GF/s))).