Mai multă putere, cu un consum mic de putere

by donpedro

Ceea ce au nevoie astăzi aplicațiile IoT industriale este o combinație de tehnologie de procesor de înaltă performanță cu consum redus de putere, funcționare robustă în timp real, conectivitate în timp real și tehnologii ‘hypervisor’1) în timp real. Dispunând de cea mai recentă generație de procesoare Intel Atom, Celeron și Pentium, plăcile și modulele de la congatec oferă mai multă putere pentru aplicații cu consum mic de energie, în orice aspect.

Piețele țintă includ automatizarea și controlul – de la controlere de proces distribuite în rețele energetice inteligente și în industria prelucrătoare, până la robotică inteligentă, sau chiar controlere PLC și CNC pentru fabricarea componentelor discrete. Alte piețe în timp real se găsesc în tehnologiile de testare și măsurare și în aplicațiile de transport, cum ar fi sistemele feroviare sau vehiculele autonome, toate acestea beneficiind și de opțiunile de operare în condiții extinse de temperatură.

Figura 1: Plăcile și modulele congatec echipate cu procesoare Intel Elkhart Lake conving pe întreaga gamă, oferind îmbunătățiri semnificative ale performanței față de procesoarele Apollo Lake cu performanțe mai mari pe watt.

Noua generație de procesoare cu consum mic de putere se potrivește perfect și pentru aplicații grafice complexe, cum ar fi POS-uri conectate la marginea rețelei, chioșcuri și sisteme de semnalizare digitală sau terminale distribuite de jocuri de noroc, pentru care noile plăci și module congatec oferă, de asemenea, comunicație de la distanță M2M (machine-to-machine) îmbunătățită. Noile procesoare Intel Atom, Celeron și Pentium de mică putere (nume de cod Elkhart Lake) vor cuceri rapid piața aplicațiilor de calcul embedded și edge (de margine) și vor deveni liderul de necontestat al aplicațiilor de calcul embedded, fără sisteme de aerisire și cu consum mic de putere, de la 4.5 la 12 wați. Există multe motive întemeiate pentru aceasta:

O creștere semnificativă a performanței procesorului

Noile procesoare ‘low-power’ Intel Atom, Celeron și Pentium oferă o creștere semnificativă a performanței – de până la 50% ‘multi thread’2) și chiar până la 70% ‘single thread’3) – față de generația anterioară, bazată pe microarhitectura Apollo Lake4). Pentru multe aplicații industriale, este, de asemenea, important să fie acceptat un interval de temperatură extins, de la -40°C la + 85°C. Cu până la 4 nuclee și rate de ceas maxime de până la 3 GHz în modul boost, noile procesoare aduc îmbunătățiri semnificative ale performanței pe întreaga piață embedded, inclusiv pentru aplicații ‘single’ sau ‘multi-thread’.

Mai mult, faptul că tehnologia de fabricație a procesorului Intel Atom este acum disponibilă pe 10nm are o importanță și mai mare pentru aplicațiile embedded. Utilizatorii de soluții embedded bazate pe arhitecturile Intel anterioare de mică putere, cu nume de cod Apollo Lake (14nm), Braswell (14nm) sau Bay Trail (22nm), care migrează către noile variante Elkhart Lake pot beneficia – pentru prima dată – de avantajele tehnologiei Intel SuperFin. Pe lângă densitatea de integrare mai mare, aceasta oferă fie un consum mai mic de energie la aceeași performanță, fie performanță mai mare la TDP4) egal. Ambele aspecte sunt esențiale în proiectele embedded. O comparație a noilor modele, care sunt disponibile în variante de la 4.5 la 12 wați, arată că utilizatorii fiecărei clase TDP pot beneficia de creșteri semnificative ale performanței. Și întrucât modurile de economisire a energiei ale procesoarelor sunt certificate Energy Star 3.0, aplicațiile conectate consumă foarte puțină putere în modul de așteptare, fără a fi nevoie de un cip special proxy de rețea.

Creșterea ratei volumului de date este susținută de mai multă memorie RAM, care poate fi extinsă până la maxim 16 GB de memorie LPDDR4 cu până la 4267 MT/s. Aplicațiile în timp real critice beneficiază, de asemenea, de implementări ECC mai rentabile, întrucât codul Intel de corectare a erorilor (IBECC Inband Error Correction Code) permite o utilizare mai bună a memoriei convenționale în locul unei memorii RAM ECC dedicate. Clienții pot configura în BIOS modul ECC și non-ECC. Faptul că este posibil să se aplice IBECC numai pentru anumite zone de memorie este un avantaj deosebit, deoarece înseamnă că dezvoltatorii nu trebuie să aleagă între ‘totul sau nimic’. De exemplu, zona de memorie rezervată unei mașini virtuale pentru aplicații critice poate fi protejată împotriva erorilor de date prin activarea IBECC-ului, în timp ce memoria principală rămasă funcționează fără această caracteristică în favoarea unor viteze de transfer de date mai mari. Dar chiar și cu IBECC-ul activat, ratele de date obținute sunt adesea de peste două ori mai mari decât în cazul memoriei ECC DDR3L de pe procesoarele Intel Atom E3900.

Memoria flash UFS 2.1 (Universal Flash Storage) integrată este atractivă în acest context. Comparativ cu eMMC, această nouă tehnologie de stocare are o lățime de bandă mult mai mare, un transfer de date mai rapid și capacități de stocare mai mari. Toate acestea sunt oferite pe aceeași amprentă, iar memoria UFS poate fi folosită chiar și ca dispozitiv de boot primar.

Figura 2: Trei frați: SMARC, Qseven și COM Express Mini Computer-on-Modules au dimensiuni comparabile; principala diferență este pur și simplu că, în timp, OEM-urile au ales între diferiți factori de formă.

Aplicații grafice de două ori mai rapide pentru experiențe captivante

Noile plăci și module de la congatec oferă, de asemenea, o grafică impresionantă la o viteză de două ori mai mare pentru până la 3x 4k @ 60fps și o adâncime de culoare de 10 biți7). Această creștere masivă a performanței grafice a fost posibilă prin integrarea unității grafice Intel din a 11-a generație (încorporată și în procesoarele semnificativ mai puternice Intel Core din a 10-a generație (Ice Lake). Din nou, procesorul GPU (Graphics Processing Unit) este prezent pe matrița unității centrale (CPU) și beneficiază de performanța și optimizările energetice oferite de tehnologia de fabricație de 10nm. Dar, mai presus de toate, creșterea performanței provine de la numărul de unități de execuție (UE) integrate, de până la 32 (UE Execution Units (n.red.: numite și unități funcționale)). Performanța grafică este, prin urmare, dublată pur și simplu, datorită unei eficiențe mai mari și a numărului crescut de unități de execuție (UE); de exemplu, procesoarele grafice din a noua generație (Apollo Lake) conțineau maxim 18 unități de execuție (UE). Unitățile de procesare grafică din a 11-a generație oferă o lățime de bandă mai mare, compresie mai bună, cache L3 mai mare și rate de transfer de date maxime mai mari.

Figura 3: COM Express Compact este o placă utilizată în principal pentru proiecte care necesită performanțe mai mari. Fiind o platformă ‘low-end’ destinată unei game largi de performanțe scalabile, aceasta permite dezvoltări cost-eficiente.

De asemenea, acestea suportă toate API-urile majore de accelerare, cum ar fi DirectX 12, OpenGL 4.5, Vulkan 1.1, OpenCL 1.1 și Metal, făcându-le ideale pentru grafică 3D și o gamă largă de aplicații grafice de tip GPGPU (General-Purpose Graphics Processing Unit). Aplicațiile video intense, precum semnalizare digitală, jocuri, streaming8) și sisteme AV head-end, beneficiază de codificare cu accelerare hardware și decodificare a celor mai recente codec-uri HEVC (High Efficiency Video Coding) (H. 265) și VP9, precum și a celor anterioare, larg utilizate, AVC (Advanced Video Coding) (H.264) și AV1.

Transfer de date mai mare datorită PCIe (Gen 3) și USB 3.1 (Gen2)

Pentru mulți dezvoltatori, transferul mai mare de date către periferie va fi, de asemenea, un beneficiu cheie oferit de noile procesoare Intel Core. Pentru prima dată, tehnologia de magistrală PCIe (Peripheral Component Interconnect Express) din a treia generație este disponibilă într-un procesor ‘low-power’, ceea ce înseamnă că viteza de transfer a datelor s-a dublat până la maxim 32 Gigabyte/s (16 Gigabyte pe canal de ieșire și retur), comparativ cu magistrala PCIe din a doua generație existentă pe Apollo Lake. Acest lucru se realizează acum la o frecvență de ceas de 8 GHz în loc de 5 GHz.

O altă caracteristică nouă pentru x86 cu consum redus de putere este suportul USB 3.1 din a doua generație, care oferă o creștere semnificativă a performanței în comparație cu USB 3.1 din prima generație. Cu până la 10 GBit/s, acest lucru permite transferuri de date de două ori mai rapide comparativ cu USB 3.1 Gen1, făcând posibilă – pentru prima dată – transferarea semnalelor video UHD necomprimate prin USB, de exemplu, de la o cameră la un monitor.

Cu toate acestea, creșterea ratei de ceas a magistralelor PCI poate avea un impact major asupra proiectării sistemului, deoarece acest lucru atrage noi provocări pentru dezvoltatorii de plăci carrier, în special în ceea ce privește conformitatea semnalului. Vitezele mai mari de ceas duc la o rutare mult mai complexă și predispusă la erori. Prin urmare, congatec oferă clienților săi servicii complete de proiectare a plăcilor carrier și teste de conformitate. Acest lucru îi scutește pe clienți de a apela la laboratoare externe iar, în cazul apariției unor probleme, oferă și avantajul suplimentar că aceștia pot vorbi direct cu experții care au testat deja cu atenție numeroase alte combinații de plăci COM și carrier, adică beneficiază exact de expertiza necesară.

Sisteme de operare în timp real hard9) – chiar și prin Ethernet standard

Funcțiile noilor plăci și module, care sunt deosebit de apreciate în aplicațiile industriale în timp real bazate pe VxWorks și Linux în timp real, sunt TSN (Time Synchronized Networking), Intel® TCC (Time Coordinated Computing) și suport RTS (Real-Time Systems) Hypervisor.

TSN permite aplicații Internet tactile prin IP în timp real ‘hard’. Noile module și plăci bazate pe procesorul Intel Atom de la congatec oferă MAC-uri integrate care acceptă TSN peste 1 GbE. Sprijinind TSN, deja, de foarte mult timp, congatec oferă, de asemenea, platforme de dezvoltare care combină TSN cu controlul în timp real. Clienții care doresc să integreze TSN în aplicațiile lor pot, prin urmare, beneficia de soluții – deja disponibile – pentru aplicații gata de utilizat.

Figura 4: Placa Pico-ITX este pregătită pentru utilizare imediată. Accesoriile extinse și numeroasele variante de modele, care provin de la companii partenere sau VAR (value-added reseller) recomandă placa Pico-ITX ca fiind o alegere atractivă chiar și pentru aplicații care necesită comenzi minime. De asemenea, congatec se oferă să consilieze clienții cu privire la alegerea partenerului de sistem potrivit.

Tehnologia TCC orchestrează comunicarea în timp real bazată pe Intel IP pentru a reduce latența și a minimiza jitterul (n.red.: jitter: fluctuația ratelor de întârziere în rețea) în procesele sincrone, lucru ce se poate ajusta prin intermediul setului de instrumente Intel® TCC Software Toolkit. Acest aspect poate fi util pentru aplicațiile în timp real din domeniul transporturilor, unde trebuie integrată magistrala CAN.

Suport complet de virtualizare pentru consolidarea hardware-ului

Bineînțeles, virtualizarea hardware joacă un rol important în sistemele conectate în timp real, deoarece multitaskingul în timp real este o cerință cheie pentru dispozitivele IoT și Edge. Procesoarele Intel Atom suportă virtualizare cu tehnologia Intel VT, care este o adiție importantă pentru tehnologiile de hipervizor în timp real, precum cele oferite de congatec, cu ajutorul RTS Hypervisor. De exemplu, tehnologia Intel VT suportă virtualizare I/O cu o singură rădăcină (SR-IOV)10). Aceasta permite mai multor aplicații găzduite în mașini virtuale cu sisteme de operare de uz general (GPOS) să acceseze în mod nativ o interfață I/O, de exemplu una dintre interfețele Ethernet. Aceasta este o caracteristică destul de atractivă, mai ales că oferta unor asemenea interfețe este limitată.

RTS Hypervisor de la filiala congatec ‘Real-Time Systems’ se combină perfect cu capabilitățile hardware de virtualizare ale procesoarelor Elkhart Lake pentru a rula aplicații critice în timp real – în paralel cu alte sisteme de operare multifuncționale precum Linux și Windows, fără a provoca latență. Deci, virtualizarea ajută în primul rând la consolidarea sarcinilor pe un singur sistem, numărul acestora crescând rapid în sistemele de control industrial de ultimă generație, unde, pe lângă sarcinile propriu-zise de control, deseori, sunt necesare și alte interacțiuni în timp real. În plus, într-o aplicație tipică IIoT, schimbul de date este necesar atât pentru a monitoriza mașinile distribuite și pentru a optimiza performanța echipamentelor, cât și pentru executa operații de întreținere predictivă. Multe aplicații necesită, de asemenea, integrarea inteligenței artificiale bazate pe viziune. Toate plăcile și modulele de la congatec echipate cu noile procesoare Intel Atom, Celeron și Pentium suportă RTS Hypervisor, o caracteristică disponibilă – în acest caz – numai la congatec.

Inteligență artificială și ‘viziune mașină’

Inteligența artificială este folosită pe scară largă pentru o analiză ‘edge’11) din zilele noastre. Noile procesoare Intel suportă un portofoliu extins de produse AI și optimizări pentru framework-uri comune. Este de remarcat, în special, suportul OpenVino și Microsoft ML. Microsoft ML este o bibliotecă software gratuită de învățare automată pentru limbajele de programare C # și F #. De asemenea, aceasta suportă modul Python atunci când este utilizată împreună cu NimbusML. Setul de instrumente OpenVINO™ include setul de instrumente Intel® Deep Learning Deployment Toolkit, OpenCV optimizat și rutine de codare și decodare media, precum și 20 de modele pre-instruite și mostre de cod. Un mod eficient de a începe cu viziunea pe computer și OpenVINO este kitul congatec de consolidare a volumului de muncă pentru aplicații de conștientizare a situației, bazate pe viziune. Kitul este o aplicație gata de utilizat, de exemplu, pentru conștientizarea contextului pentru roboți, vehicule autonome și supraveghere video, numărare pasageri și pietoni sau sisteme de verificare automată în piața de retail.

Kit de consolidare a volumului de lucru pentru aplicații de tip viziune mașină

Kitul congatec de consolidare a sarcinilor de lucru pentru aplicații de conștientizare a situației, bazate pe viziune – calificat Intel® IoT RFP Ready Kit – demonstrează beneficiile virtualizării în materie de eficiență. Kitul oferă trei mașini virtuale (VM) pentru consolidarea volumului de lucru al aplicațiilor de viziune, bazate pe tehnologie hipervizor de la Real-Time Systems (RTS). O mașină virtuală (VM) rulează o aplicație AI bazată pe viziune, utilizând software-ul Intel® OpenVino™ pentru conștientizarea situației. A doua mașină virtuală (VM) operează în timp real și rulează software de control determinist, în timp ce a treia mașină virtuală (VM) acționează ca gateway IIoT/Industry 4.0. Kitul congatec, care a fost dezvoltat în cooperare cu Intel și RTS și poate fi disponibil și cu noua generație de procesoare Intel Atom, vizează următoarea generație de robotică colaborativă bazată pe viziune, controlul mașinilor și vehiculele autonome care trebuie să îndeplinească sarcini multiple în paralel, inclusiv conștientizarea situației bazată pe algoritmi AI, bazați, la rândul lor, pe învățarea profundă (deep learning).

Figura 5: Plăcile carrier de evaluare sunt disponibile pentru toate modulele noi.

Îmbunătățiri semnificative ale securității

Toate dispozitivele Edge IIoT trebuie să integreze caracteristici de securitate. OEM-urile pot utiliza tehnologii de virtualizare, precum hipervizorul în timp real de la RTS, pentru a le integra. Cu toate acestea, în mod ideal, fundația este deja ancorată direct în hardware. Noua generație de procesoare cu consum redus de putere are multe de oferit și în acest sens. De exemplu, noile plăci și module bazate pe procesoarele Intel Atom, Celeron și Pentium de la congatec oferă opțiuni inovatoare pentru un management mai cuprinzător în afara benzii, împreună cu o gamă completă de caracteristici de securitate încorporate, cum ar fi boot verificat prin intermediul Intel® Boot Guard 2.1, suport TPM inclusiv Intel® Platform Trust Technology (Intel® PTT) și Intel® Dynamic Application Loader (Intel® DAL) pentru a permite dezvoltarea de aplicații consistente, cu adevărat de încredere. Și când vine vorba de criptarea și decriptarea datelor, noile plăci și module oferă, de asemenea, mai mult. Noile instrucțiuni Intel® Advanced Encryption Standard New Instructions (AES-NI) și extensiile SHA pentru algoritmi Secure Hash accelerate hardware sunt acum și mai puternice. O caracteristică complet nouă este suportul procesorului cu algoritmi de criptare SMx utilizați în special în China. În cele din urmă, protecția împotriva copierii HDCP 2.3, care este necesară pentru redarea celor mai recente media HD, este, de asemenea, disponibilă acum.

Operare continuă 24/7 și suport pe termen lung

Noile plăci și module bazate pe procesoare Intel Atom, Celeron și Pentium de la congatec sunt proiectate pentru o fiabilitate ridicată și o durată lungă de viață. Pentru procesoarele care urmează să fie utilizate în medii industriale dure, Intel oferă 10 ani de operare continuă 24/7 (100% în stare de repaus S0) și temperaturi extinse de la -40°C la + 85°C sau TJ maxim de la 100°C la 110°C. Intel intenționează să ofere o disponibilitate garantată a procesorului de 15 ani, ceea ce ar permite companiei congatec să garanteze aceeași disponibilitate pentru produsele cu funcții identice – ceva care este deosebit de important pentru sectorul medical și de transport, de exemplu. În prezent, disponibilitatea standard a plăcilor de la congatec este de 10 ani. Pentru OEM-urile cu cerințe de disponibilitate mai mari, pot fi aranjate programe speciale cu disponibilitate mai mare.

Zece configurații noi

Noile plăci și module sunt disponibile în factori de formă Pico-ITX SBC, SMARC, Qseven, COM Express Compact și Mini în următoarele configurații de procesor:

Seturi de caracteristici detaliate ale diferitelor module SMARC, Qseven, COM Express Compact și Mini Computer-on-Modules, precum și Pico-ITX SBC pot fi găsite în fișele tehnice aflate în pagina congatec referitoare la procesoarele Elkhart Lake: www.congatec.com/intel-elkhart-lake

congatec

 

 

Note:
1) Hypervisor este entitatea care implementează și controlează virtualizarea, permițând în același timp, crearea / distrugerea / gestiunea resurselor virtualizate
2) Principiul de multithreading presupune execuția mai multor thread-uri în același pipeline, fiecare având propria secțiune de timp în care este menit să lucreze. Odată cu creșterea capabilităților procesoarelor, au crescut și cererile de performanță, asta ducând la solicitarea la maxim a resurselor unui procesor. Necesitatea multithreading-ului a venit de la observația că unele procesoare puteau pierde timp prețios în așteptarea unui eveniment pentru o anumită sarcină.
3) Conceptul de thread (fir de execuție) definește cea mai mică unitate de procesare ce poate fi programată spre execuție de către sistemul de operare. Este folosit în programare pentru a eficientiza execuția programelor, executând porțiuni distincte de cod în paralel, în interiorul aceluiași proces. (sursă: Wikipedia)
4)7) Sursă Intel. Performanțe bazate pe a) Estimări metrice SPEC CPU 2006 bazate pe proiecții Pre-Silicon și b) Estimări 3DMark11 bazate pe proiecții Pre-Silicon, utilizând Intel® Pentium® J4205 din generația anterioară.
Configurații: (Rezultatele se bazează pe proiecțiile de la 1 Septembrie, 2020)
Procesor: Intel® Pentium® J6425 PL1=10W TDP, 4C4T Turbo până la 3.0GHz
Unitate grafică: Intel Graphics Gen 11 gfx
Memorie: 16GB LPDDR4-3200
Sistem de operare (OS): Windows* 10 Pro
Versiune Compilator: IC18

Procesor: Intel® Pentium® J4205 PL1=10W TDP, 4C4T Turbo până la 2.6GHz
Unitate grafică: Intel Graphics Gen 9 gfx
Memorie: 16GB LPDDR4-2400
Sistem de operare OS: Windows* 10 Pro
Versiune Compilator: IC18

Performanțele obținute sunt proiecții Pre-Silicon și pot fi modificate. Rezultatele raportate pot necesita revizuirea pe măsură ce se efectuează teste suplimentare. Rezultatele depind de configurațiile specifice ale platformei și de sarcinile de lucru utilizate în testare și pot să nu fie aplicabile componentelor utilizatorilor, sistemului de computer sau încărcărilor de lucru. Rezultatele nu sunt neapărat reprezentative pentru alte repere.

5) TPD – Thermal Design Power; uneori numit punct de proiectare termică, este cantitatea maximă de căldură generată de un cip sau componentă a calculatorului (adesea un procesor, GPU sau un SoC – sistem pe un cip) pe care sistemul de răcire dintr-un computer este proiectat să-l disipeze, indiferent de volumul operare.)
6) O pierdere în cache este o încercare eșuată de a citi sau scrie o bucată de date în cache, ceea ce duce la un acces la memorie principal cu o latență mult mai lungă.
8) Streaming (engleză: stream – curgător, flux continuu) este o tehnologie multimedia prin care transferul de date de la sursă la destinație este perceput ca un flux continuu. Prin streaming fișierele video sau audio se deschid și rulează în timp real, în timp ce se încarcă.
9) Sistemele de operare în timp real pot fi divizate în sisteme în timp real hard și sisteme în timp real soft. Majoritatea sistemelor de operare în timp real sunt sisteme în timp real soft, cum ar fi cele utilizate pentru controlul de la distanță al diverselor aparate și dispozitive multimedia, electrocasnice etc. Sistemele în timp real hard sunt prevalente în procesele industriale, în care constrângerile temporale sunt întotdeauna prioritare, fiind în general, mult mai complexe (de exemplu, sistemele de control al zborurilor).
10) SR-IOV (Single root I/O virtualization) este o arhitectură standard PCIe (Peripheral Component Interconnect Express) care defineşte extensii pentru ca specificaţiile PCIe să activeze partiţii logice multiple care rulează simultan pe un sistem pentru a partaja dispozitive PCIe. Arhitectura defineşte replici virtuale ale funcţiilor PCI cunoscute ca funcţii virtuale (VF). O partiţie logică se poate conecta direct la un adaptor SR-IOV VF fără a trece printr-un intermediar virtual (VI) cum ar fi un Hipervizor POWER or Virtual I/O Server. Acest lucru oferă o latenţă mică şi o utilizare CPU scăzută evitând un VI. (https://www.ibm.com/support/knowledgecenter/ro); Virtualizare – este mecanismul prin care se creează o entitate cu (aproape) toate funcționalitățile unei entități fizice, fără ca aceasta să existe fizic
11) Analiza Edge este colectarea, procesarea și analiza datelor la marginea unei rețele, fie la un senzor, un comutator de rețea sau alt dispozitiv conectat, fie lângă acesta.

S-ar putea să vă placă și