Recent, Renesas și-a extins populara familie de microprocesoare (MPU) RZ cu un nou dispozitiv adresat aplicațiilor robotice de înaltă performanță. Oferind cele mai înalte niveluri de performanță din cadrul familiei, RZ/V2H permite atât capabilități de viziune AI, cât și de control în timp real. Noul microprocesor RZ/V2H va fi prezentat la standul Renesas de la expoziția Embedded World din acest an (Pavilionul 1, Standul 234 (1-234). Am avut ocazia să discutăm cu domnul Keigo Kawasaki, Director de marketing la Renesas, despre noul membru al familiei RZ și despre noile sale caracteristici care vor îmbunătăți aplicațiile de robotică și vor juca un rol important în evoluția ulterioară a AI.
Tot mai mulți producători de semiconductori oferă acum procesoare AI. Prin ce se diferențiază Renesas în raport cu competitorii?
Trei elemente cheie ne diferențiază:
- Acceleratorul AI “DRP-AI3” cu tehnologie “Pruning” – Pruning este o abordare bazată pe hardware care permite crearea de modele AI ‘ușoare’ și îmbunătățește eficiența calculului AI. Aceasta a condus la o eficiență energetică de 10 TOPS/W, adică o îmbunătățire de 10 ori mai mare față de modelele anterioare.
- Accelerarea procesării imaginilor pe lângă accelerarea AI – Pentru a crește performanța întregului sistem de imagistică, RZ/V2H include acceleratorul OpenCV, împreună cu biblioteca de accelerare OpenCV gratuită.
- În afară de procesorul cu patru nuclee Arm Cortex-A55 de 1,8 GHz pentru procesarea aplicațiilor, dispozitivul oferă performanțe robuste de control în timp real cu procesoare cu două nuclee Cortex-R8 de 800 MHz și un procesor Cortex-M33 pentru gestionarea sarcinilor mai puțin intensive, precum recuperarea datelor de la senzori. RZ/V2H de la Renesas este singurul procesor AI heterogen echipat cu toate cele trei nuclee Cortex (A, R, M) de la Arm.
Care sunt provocările în implementarea AI pentru viziune, în special în sistemele embedded? Care este soluția celor de la Renesas?
Generarea de căldură este o provocare majoră în sistemele embedded. Deoarece procesoarele de înaltă performanță generează căldură, inginerii se confruntă deseori cu provocări privind compensarea căldurii, fie prin scăderea performanței, fie prin adăugarea de componente de disipare a căldurii, ceea ce, la rândul său, crește costul și dimensiunea sistemului. Cu o eficiență energetică AI de 10 TOPS/W, RZ/V2H de la Renesas poate îndeplini cu ușurință aplicații AI de viziune de înaltă performanță fără ventilatoare de răcire.
Ce aplicații necesită procesarea imaginilor în timp real?
Roboții industriali pentru automatizarea fabricilor și roboții pentru servicii din restaurante și spații comerciale necesită capacități de procesare a imaginilor în timp real. Aceștia sunt roboți care pot recunoaște obiectele și obstacolele din jur în timp real și se pot deplasa autonom. În plus, dronele și vehiculele mici de transport trebuie, de asemenea, să ‘gândească’ independent și să acționeze în timp real. RZ/V2H este ideal pentru astfel de aplicații.
Ce fel de comentarii ați primit din partea clienților?
Mulți clienți au decis deja să adopte modulele noastre AI pentru aplicații industriale și module mici pentru HSR (Human Support Robot). Sunt și peste 40 de clienți care iau în considerare produsele noastre. Factorul decisiv în toate aceste discuții este legat de capacitatea RZ/V2H de a reduce semnificativ generarea de căldură.
Ce accelerează adoptarea pe scară largă a aplicațiilor de viziune AI? Care este strategia Renesas?
Apare o mare provocare dată de utilizarea eficientă a inteligenței artificiale, unde inginerii trebuie să aibă competențe specializate în domeniu. Renesas oferă gratuit o serie de biblioteci de aplicații AI pentru a răspunde provocărilor clienților.
Vorbiți-ne despre viitoarea foaie de parcurs a Renesas.
În ceea ce privește tehnologia, vom continua să urmărim TOPS/W pentru a îmbunătăți performanța energetică. În viitor, ne așteptăm ca dispozitivele embedded să aibă parte de aplicații care necesită mai multă performanță de calcul, cum ar fi inteligența artificială generativă. Din punct de vedere al productivității, vom continua să răspundem cerințelor clienților și pieței noastre.
Care sunt avantajele oferite de tehnologia DRP brevetată de Renesas?
DRP (Dynamically Reconfigurable Processor – Procesor reconfigurabil dinamic) poate executa aplicații în timp ce comută dinamic configurația de conectare a circuitelor unităților aritmetice de pe cip la fiecare semnal de ceas în funcție de conținutul care urmează să fie procesat. Deoarece sunt utilizate doar circuitele aritmetice necesare, DRP consumă mai puțină putere decât în cazul procesării cu CPU și poate atinge o viteză mai mare. În plus, în comparație cu unitățile centrale de procesare, care se confruntă cu o performanță diminuată provocată de accesările frecvente ale memoriei externe în urma ratării cache-ului și a altor factori, DRP poate construi căile de date necesare în hardware. Acest lucru minimizează deprecierea performanțelor și reduce variația vitezei de operare (jitter) din cauza acceselor la memorie.
De asemenea, DRP are o funcție dinamică de reconfigurare care comută informațiile de conectare a circuitului de fiecare dată când se schimbă algoritmul, permițând procesarea cu resurse hardware limitate, chiar și în aplicațiile robotice care necesită procesarea mai multor algoritmi.
Tehnologia DRP este deosebit de eficientă în procesarea fluxurilor de date, cum ar fi recunoașterea imaginilor, unde paralelizarea și pipeline-ul îmbunătățesc direct performanța.
Care sunt avantajele unei arhitecturi heterogene în care DRP-AI3, DRP și CPU operează împreună fără probleme?
Roboții din domeniul serviciilor, de exemplu, au nevoie de o procesare avansată a inteligenței artificiale pentru a recunoaște mediul înconjurător. Pe de altă parte, procesarea bazată pe algoritmi care nu utilizează AI trebuie, de asemenea, să decidă și să controleze comportamentul robotului. Însă, procesoarele embedded (CPU) actuale nu dispun de resurse suficiente pentru a efectua aceste tipuri variate de prelucrare în timp real. Renesas a rezolvat problema prin dezvoltarea unei tehnologii de arhitectură heterogenă, care permite acceleratorului AI (DRP-AI3), acceleratorului OpenCV (DRP) și procesoarelor să lucreze împreună.
DRP AI3 accelerează procesarea de viziune AI. Renesas a aplicat propria sa tehnologie DRP pentru a dezvolta acceleratorul OpenCV, care accelerează procesarea OpenCV, o bibliotecă standard industrială open-source pentru procesarea de viziune pe calculator. Astfel a rezultat o îmbunătățire a vitezei de până la 16 ori mai mare în comparație cu procesarea bazată pe CPU. Combinația dintre DRP-AI și OpenCV Accelerator îmbunătățește atât calculul AI, cât și algoritmii de procesare a imaginilor, permițând executarea eficientă din punct de vedere energetic și în timp real a Visual SLAM, utilizată în aplicații precum aspiratoarele robotizate.
Pe de altă parte, programe precum cele de luare a deciziilor și de control al comportamentului roboților necesită o procesare precisă, pentru a răspunde condițiilor schimbătoare și modificărilor din mediul înconjurător. Pentru a face acest lucru, procesarea software prin CPU poate fi mai potrivită decât procesarea hardware, precum DRP. Este important să se distribuie procesarea în locurile potrivite și să se opereze într-o manieră coordonată. Tehnologia de arhitectură heterogenă de la Renesas permite DRP-ului și CPU-ului să lucreze împreună.
Are Renesas planuri de a dezvolta o unitate de procesare neurală (NPU)?
“NPU” este un termen generic pentru hardware IP specializat pentru procesarea AI, iar DRP-AI este un tip de NPU.
Care sunt noile tehnologii pe care DRP-AI3 le folosește în RZ/V2H?
DRP-AI3 introduce metode de mare viteză și cu consum redus de energie care susțin principalele tehnici de simplificare a modelelor AI. Mai exact, sunt acceptate următoarele variante de reducere a complexității:
1) Cuantizare: Reducerea numărului de biți privind informațiile despre greutatea rețelei neurale (greutate) și datele de intrare/ieșire (harta caracteristicilor) pentru fiecare strat. Se trece de la aritmetica în virgulă mobilă pe 16-biți din DRP-AI convențională la aritmetica numerelor întregi pe 8-biți (INT8).
2) Branch pruning: (tăierea (sau eliminarea) ramurilor): O tehnică de ignorare a calculelor prin setarea la zero a informațiilor despre greutate (ramuri) care nu afectează precizia recunoașterii.
Un conținut tehnic mai detaliat a fost prezentat la ISSCC 2024 (International Solid-State Circuits Conference 2024), o conferință internațională de prestigiu privind circuitele semiconductoare, desfășurată în perioada 18-22 februarie 2024. Comunicatul de presă a fost emis la 22 Februarie 2024.
Sunt deja disponibile combinații câștigătoare/proiecte de referință pentru RZ/V2H?
Renesas a dezvoltat placa “Visual Detection Single Board Computer”, care utilizează imaginile camerei pentru a identifica împrejurimile și pentru a determina și controla mișcările în timp real. Această soluție combină RZ/V2H cu circuite integrate pentru managementul puterii și generatoare de ceas programabile VersaClock astfel încât să optimizeze consumul energetic al roboților și mașinilor industriale.
Designul său eficient elimină cerința unui ventilator de răcire suplimentar, menținând reduse dimensiunea și lista de materiale a soluției. Această combinație câștigătoare va fi expusă la standul Renesas (1-234) la embedded world 2024.
Vorbiți-ne despre oferta de dispozitive din seria RZ/V.
Seria RZ/V este formată din microprocesoare care încorporează un accelerator numit DRP-AI. Oferim o gamă scalabilă de la 0,5 TOPS până la 80 TOPS având aceeași arhitectură.
Renesas Electronics Europe | https://www.renesas.com