Prima arhitectură x86 hibridă cu adevărat performantă oferă un salt cuantic în ceea ce privește numărul de nuclee

by donpedro

Cea de-a 12-a generație de procesoare Intel Core pentru dispozitive mobile și desktop a sosit recent în spațiul de calcul embedded, cu implementări pe standardele Computer-on-Module de înaltă performanță COM-HPC și COM Express. Dispunând de o arhitectură hibridă inovatoare în materie de performanță, noile procesoare embedded ‘high-end’, denumite anterior sub numele de cod Alder Lake, sunt mai mult decât o altă generație de procesoare Intel Core i9, i7, i5 sau i3. Așadar, unde este diferența și la ce se pot aștepta proiectanții de dispozitive embedded și edge de ultimă generație de la aceste noi module?

Nu doar creșterea obișnuită a performanțelor face ca noile module bazate pe tehnologia procesorului Intel Core din a 12-a generație să fie atractive. Cel mai impresionant este faptul că inginerii pot acum să valorifice până la 14 nuclee/20 fire de execuție pentru variantele de procesoare mobile BGA și până la 16 nuclee/24 fire de execuție pentru variantele de procesoare desktop (cu montare pe soclu LGA). Acest lucru oferă cu adevărat un salt calitativ în ceea ce privește opțiunile de multitasking, procesare paralelă, virtualizare și scalabilitate, în comparație cu modulele anterioare COM Express Type 6 și COM-HPC Client Size A cu procesoare Intel Core și Xeon din a 11-a generație, care dispuneau doar de cel mult 8 nuclee. Totuși, numărul dublat de nuclee nu înseamnă că proiectanții vor obține de două ori mai multă performanță, deoarece arhitectura hibridă oferă același număr de nuclee de înaltă performanță – așa-numitele nuclee de performanță (P-cores). Acestea sunt completate, însă, de nuclee cu consum redus de putere, așa-numitele nuclee eficiente sau, pe scurt, E-cores. Noua arhitectură hibridă oferă numeroase avantaje pentru diverse domenii de aplicații embedded.

Figura 1: Pentru aplicațiile hibride de timp real și sistem de operare standard, modulele CoM de la congatec cu procesoare Intel Core din a 12-a generație oferă implementări RTS Hypervisor prevalidate de la Real-Time-Systems pentru a simplifica certificarea acestei noi arhitecturi hibride x86. — © congatec

Stații de lucru de nivel industrial

Deoarece această nouă generație de procesoare embedded este – în general – un derivat al procesoarelor IT standard pentru întreprinderi, echipamentele industriale de tip stație de lucru sunt primele domenii de aplicații care vor beneficia de această tehnologie. Astfel de echipamente sunt necesare într-o varietate de piețe verticale diferite, de la sisteme medicale pentru procesarea imaginilor în dispozitive cu ultrasunete până la echipamente profesionale de radiodifuziune și divertisment pentru procesare video și sunet. Cereri similare de robustețe și performanță vin din partea sistemelor de supraveghere video inteligente staționare pentru siguranța publică în orașe, gări și pe autostrăzi. Sau de la echipamentele utilizate în sistemele din camerele de control, unde sarcinile de lucru sunt de obicei ridicate, iar diverse sarcini eterogene trebuie să ruleze în paralel. Unele dintre aceste sarcini trebuie să fie executate pe nuclee performante, dar multe altele pot fi rulate pe nucleele E-cores cu consum redus de energie, ceea ce sporește eficiența generală a sistemului.

Aplicații ‘Edge’ și utilaje mobile

Dincolo de aceste aplicații industriale, de tip IT standard, există multe alte domenii care pot beneficia de noile opțiuni de balansare a performanțelor oferite de noua arhitectură hibridă Intel cu număr masiv de nuclee. Exemple bune cu cerințe hibride și mai mari sunt computerele edge și gateway-urile IoT (aflate într-o mare dezvoltare) utilizate în vehiculele logistice autonome, utilajele mobile pentru agricultură sau pentru construcții și în mașinile comerciale. Alte piețe importante sunt aplicațiile de automatizare inteligentă a fabricilor și proceselor, inclusiv inspecția calității bazată pe inteligență artificială și robotica colaborativă, care încorporează viziunea industrială și controlul în timp real. Toate aceste sisteme integrează mașini virtuale multiple pentru sarcini precum viziune bazată pe inteligență artificială, control în timp real și conectivitate securizată, care trebuie să funcționeze în paralel. Totuși, nu toate aceste sarcini necesită cea mai înaltă performanță. Tocmai de aceea, echilibrarea performanțelor firelor de execuție pe bază hardware – și, implicit, cea mai eficientă – pentru o alocare optimă a resurselor este una dintre inovațiile oferite de această nouă generație de computere pe module.

Aplicații în timp real, inclusiv TSN

Intel Thread Director oferă în mod nativ inteligența de echilibrare a performanței thread-urilor, astfel încât proiectanții nu trebuie neapărat să aloce manual thread-uri pe anumite nuclee. Ei pot folosi logica încorporată a acestei tehnologii Intel, care instruiește planificatoarele sistemelor de operare la fiecare 30 ms pentru a aloca firele de execuție pe nucleele cele mai potrivite pentru cea mai mare eficiență. Acest lucru duce la îmbunătățiri semnificative pentru aplicațiile din viața reală, care combină în paralel sarcini întregi, vectoriale și de inteligență artificială, plus operațiuni de fundal. În cazul aplicațiilor în timp real, alocarea resurselor este deosebit de dificilă, deoarece sistemul de operare trebuie să poată dezactiva alocarea nucleelor pentru a permite calcule și timpi de răspuns deterministici. Aici intră în joc tehnologia hipervizorului, cum ar fi hipervizorul RTS de la Real-Time Systems. Proiectată pentru a aloca resurse dedicate aplicațiilor în timp real, soluțiile adecvate pot fi implementate rapid și ușor cu ajutorul tehnologiei hipervizorului – dar este necesară o înțelegere aprofundată a comportamentului noilor nuclee de procesor. Prin urmare, platformele de calcul embedded, care sunt precalificate pentru astfel de tehnologii, reprezintă punctul de plecare perfect, deoarece facilitează calificarea noii arhitecturi x86 hibride. Cu ajutorul virtualizării, mașinile în timp real pot rula pe toate cele 8 nuclee ‘E-cores’, lăsând nucleele ‘P core’ să se ocupe de sarcinile secundare care necesită performanțe sporite, cum ar fi conștientizarea controlată prin inteligență artificială pe baza tehnologiilor de viziune embedded. Un singur procesor poate astfel să alimenteze celule întregi de producție din industria auto cu diverși roboți de conștientizare a situației (coboți aka) – inclusiv sisteme în timp real critice și cu suport Intel TCC și TSN, nu numai pentru procesorul propriu-zis, ci și, în mod nativ, prin cablare Ethernet standard.

Consolidarea sarcinilor de lucru pe o singură platformă

Odată ce începeți să vă gândiți la un astfel de concept de utilizare a procesorului “unul pentru toate sarcinile”, ideea de consolidare a sistemului pentru sarcini eterogene nu este departe. Computerele echipamentelor de producție care, anterior, erau utilizate separat pentru HMI, diferite controlere, gateway-uri IoT și implementări ale Industriei 4.0 pot fi găzduite pe o singură platformă – cu toate economiile de costuri și îmbunătățirile de fiabilitate care decurg de aici. Iar acest lucru se poate face cu o execuție a thread-urilor mult mai rapidă și mai eficientă din punct de vedere energetic decât până acum, toate gestionate automat de Intel Thread Director – cu excepția aplicațiilor în timp real.

Figura 2: Inginerii pot alege fie modulul consacrat COM Express Type 6 pentru proiectele existente, fie modulele COM-HPC Client A Size sau Client C Size nou-nouțe pentru noile dezvoltări. — © congatec

Pe lângă configurația hibridă a nucleelor, noile procesoare Intel Core – disponibile în versiunile LGA (cu montare pe soclu) și BGA (cu montare prin lipire) – oferă numeroase avantaje suplimentare. Procesoarele mobile BGA, de exemplu, vin cu până la 96 de unități de execuție oferite de grafica integrată Intel Iris Xe și se estimează că oferă îmbunătățiri extraordinare de până la 129% în ceea ce privește performanța grafică, în comparație cu procesoarele Intel Core din a 11-a generație. Acest lucru nu numai că permite o experiență cu adevărat captivantă pentru utilizator, dar accelerează și procesarea sarcinilor de lucru înalt paralelizate, cum ar fi algoritmii AI.

Performanțe îmbunătățite cu 94% și rate de transfer mai mari cu până la 181%

Optimizată pentru cele mai înalte performanțe în domeniul aplicațiilor embedded, grafica modulelor bazate pe procesoare LGA oferă acum performanțe mai mari cu până la 94%. Un alt fapt uimitor, care are o relevanță deosebită pentru sistemele de viziune cu AI, este că performanța inferenței în clasificarea imaginilor aproape că s-a triplat, cu un randament mai mare cu până la 181%. În plus, modulele oferă o lățime de bandă masivă pentru conectarea GPU-urilor discrete pentru a obține performanțe grafice maxime și performanțe AI bazate pe GPGPU. În comparație cu versiunile BGA, acestea și toate celelalte periferice beneficiază de o viteză încă o dată dublată a lane-urilor, deoarece vin cu tehnologia de interfață ultra-rapidă PCIe 5.0, în plus față de PCIe 4.0 de pe procesor. Mai mult, chipseturile pentru desktop oferă până la 8 lane-uri PCIe 3.0 pentru conectivitate suplimentară, în timp ce variantele mobile BGA oferă până la 16 lane-uri PCIe 4.0 de pe CPU și până la 8 lane-uri PCIe 3.0 de pe chipset. Pe lângă aceste creșteri masive de performanță, există suport pentru o memorie de sistem de până la 128 GByte, astfel încât proiectanții de stații de lucru de ultimă generație care consolidează mai multe mașini diferite pe un singur procesor nu vor mai trebui să se lupte vreodată cu blocajele de memorie.

AI, AI, AI

Nu în ultimul rând, noua generație Intel Core impresionează prin motoarele AI dedicate care suportă Windows ML, setul de instrumente Intel Distribution of OpenVINO și Chrome Cross ML. Diferitele sarcini de lucru AI pot fi delegate fără probleme către nucleele P-cores, E-cores și unitățile de execuție GPU pentru a procesa chiar și cele mai intensive sarcini edge AI. Tehnologia integrată Intel Deep Learning Boost utilizează diferite nuclee prin intermediul instrucțiunilor Vector Neural Network (VNNI), iar grafica integrată suportă instrucțiuni GPU DP4a accelerate AI care pot fi scalate la GPU-uri dedicate. Mai mult, acceleratorul AI încorporat cu cel mai mic consum de putere de la Intel, Intel Gaussian & Neural Accelerator 3.0 (Intel GNA 3.0), permite suprimarea dinamică a zgomotului și recunoașterea vocală și poate chiar răspunde la comenzi vocale de trezire în timp ce procesorul se află în stare de consum redus de energie. Combinând aceste caracteristici cu suportul tehnologiei hipervizorului de la Real-Time Systems, precum și cu suportul sistemului de operare pentru Real-Time Linux și Wind River VxWorks, se obține un ecosistem complet destinat să faciliteze și să accelereze dezvoltarea aplicațiilor de tip ‘edge computing’.

Tabelul 1: Variante ale modulelor conga-TC670 COM Express Type 6 Compact (95 mm × 95 mm) și ale modulelor conga-HPC/cALP COM-HPC Client Size A (120 mm × 95 mm) bazate pe procesoarele mobile Intel Core din generația a 12-a. — © congatec

Computere pe module în diferite variante

O nouă generație de computere pe module de la furnizorii de sisteme de calcul embedded, cum ar fi congatec, permite ca lățimea de bandă și performanța ridicată a noilor procesoare Intel Core să fie disponibile în diferite variante.

Tabelul 2: Modulele conga-HPC/cALS COM-HPC Client Size C de la congatec (120 mm × 160 mm) sunt echipate cu 4 variante diferite de procesoare Intel Core pentru desktop din a 12-a generație. — © congatec

Dezvoltatorii pot alege între noul standard emblematic COM-HPC Client, care este proiectat pentru cea mai mare lățime de bandă, sau standardul consacrat COM Express Type 6. Întrucât ambele standarde sunt găzduite de PICMG, producătorii de echipamente originale vor găsi aceeași fiabilitate și același suport din partea comunității pentru oricare factor de formă. Așadar, pe care dintre ele ar trebui să le aleagă? Pentru aplicațiile existente, se recomandă utilizarea COM Express Type 6. Proiectele noi, în special cele în care se preconizează că vor crește și mai mult cerințele de lățime de bandă și de performanță, se realizează cel mai bine cu COM-HPC, deoarece se așteaptă ca acesta să devină succesorul predominant al COM Express în următorii 5-10 ani. Totuși, în acest context, este bine de știut că proiectele COM Express vor fi susținute încă mult timp; la urma urmei, chiar și predecesorul ETX este încă în funcțiune și poate fi achiziționat și astăzi, la 23 de ani de la lansarea sa. Așadar, proiectanții nu trebuie să se îngrijoreze că au ales un factor de formă greșit, deoarece industria de calcul embedded este foarte stabilă. Aceștia au nevoie invariabil de disponibilitate pe termen lung, care este de fapt o caracteristică inerentă a modulelor computerizate, deoarece standardizarea seturilor de caracteristici și a dimensiunilor le permite inginerilor să utilizeze următoarea generație de procesoare pe aceeași placă de bază, fără costuri suplimentare NRE (n.red. Non-recurring engineering) pentru proiectarea PCB. Un alt beneficiu este scalabilitatea înaltă pentru familiile de produse – după cum ne demonstrează și cele două versiuni LGA și BGA diferite ale noii generații Intel Core.


Despre autor
Zeljko Loncaric, este inginer în cadrul departamentul de Marketing al companiei congatec.

congatec

S-ar putea să vă placă și

Adaugă un comentariu