Internetul lucrurilor (Internet of Things – IoT) transformă locuința, pentru ca aceasta să devină un loc mai plăcut, mai eficient și mai sigur pentru milioane de gospodari. Fie că este vorba de controlul aerului condiționat și al încălzirii, de setarea aparatelor de bucătărie sau a sistemelor de alarmă pentru casă, prin conectivitatea dispozitivelor compatibile cu IoT, oamenii își pot controla locuințele de oriunde s-ar afla.
Adăugarea inteligenței artificiale la IoT permite un set complet nou de funcționalități avansate. Recunoașterea facială permite sistemului de alarmă pentru casă să recunoască cine se află la ușă, permițând ca aceasta să fie deschisă doar de persoanele pe care le “cunoaște”. În mod similar, recunoașterea vocală se dispensează chiar și de dispozitivele mobile, oferind proprietarului comanda luminilor, televizoarelor și a electrocasnicelor doar prin intermediul cuvântului rostit.
Priviți cine vorbește
Tehnologia de recunoaștere facială (FRT – Facial recognition technology) reprezintă cel mai mare progres în sistemele de securitate de la introducerea camerelor CCTV și este utilizată de obicei pentru autentificarea utilizatorilor prin intermediul serviciilor de verificare a identității. Capabilă de a compara o față umană dintr-o imagine digitală sau un cadru video cu o bază de date de fețe, aceasta funcționează prin identificarea și măsurarea trăsăturilor faciale dintr-o anumită imagine. Ca atare, are un mare succes în cazul unor populații relativ mici în medii controlate.
Calitatea imaginii recepționate este un factor decisiv major în ceea ce privește performanța sistemelor FRT. Printre alți factori se numără mediul – în general, FRT funcționează mai bine atunci când pot fi comparate aspecte similare ale mediului, cum ar fi fundalul, dimensiunea și orientarea capului, distanța camerei și condițiile de iluminare. Vechimea imaginii este, de asemenea, importantă, deoarece algoritmul funcționează mai bine dacă a trecut mai puțin timp între imaginile comparate. Performanța este, de asemenea, maximizată dacă aparatul foto care a capturat imaginea de arhivă a persoanei are caracteristici optice similare cu cel care a obținut imaginea de la fața locului.
Recunoașterea vorbirii se referă la un set de tehnologii care permit calculatoarelor să recunoască cuvintele vorbite. Este cunoscută și sub numele de recunoaștere automată a vorbirii (ASR – Automatic Speech Recognition), recunoaștere a vorbirii pe calculator sau conversie a vorbirii în text (STT – Speech to Text). Unele sisteme de recunoaștere a vorbirii necesită “antrenament”, prin care o persoană citește un text sau cuvinte izolate din vocabular în sistem. Acesta analizează vocea persoanei și o folosește pentru a îmbunătăți acuratețea recunoașterii vorbirii persoanei respective. Asemenea sisteme se numesc sisteme dependente de vorbitor, în timp ce sistemele care nu folosesc antrenamentul se numesc “independente de vorbitor”.
Aplicațiile de recunoaștere a vorbirii includ interfețe vocale cu utilizatorul, cum ar fi apelarea vocală, direcționarea apelurilor, de exemplu, spunând “Aș dori să efectuez un apel cu taxă inversă”, și controlul aparatelor electrocasnice. Un exemplu familiar de recunoaștere vocală în viața de zi cu zi este Alexa de la Amazon. Atunci când întrebați despre vreme sau despre scorurile de fotbal, soluția înregistrează cuvintele dumneavoastră și le trimite către serverele Amazon, care dispun de puterea de calcul pentru a le analiza mai eficient.
Cuvintele voastre sunt descompuse în sunete individuale, care, apoi, sunt comparate cu o bază de date pentru a decide ce cuvinte se potrivesc cel mai bine cu acea combinație de sunete. Odată ce are o idee despre cuvinte, sistemul le selectează pe cele mai importante pentru a da sens sarcinii. De exemplu, dacă recunoaște cuvinte precum “ploaie” sau “temperatură”, va deschide aplicația meteo. Serverele trimit informațiile către Alexa, care poate vorbi apoi pentru a vă spune ceea ce trebuie să știți.
Cloud sau local?
Cele două opțiuni majore pentru amplasarea sistemului de inteligență artificială care va procesa datele de recunoaștere facială sau vocală sunt în Cloud sau pe dispozitivul IoT în sine.
În cazul procesării locale, plasarea puterii de calcul în dispozitive oferă un beneficiu major evident – reduce latența, adică timpul necesar pentru ca datele să ajungă de la sursă la destinație, oferind o viteză sporită. Ca urmare a acestei procesări locale, nu este nevoie de conectivitate, dar, în funcție de aplicație, este posibil să fie nevoie de o putere de calcul mult mai mare pe dispozitivul IoT. Un astfel de sistem poate fi, de asemenea, dificil de actualizat de la distanță, actualizările putând fi limitate de performanța hardware-ului. Un aspect din ce în ce mai important este securitatea. Prelucrarea distribuită a datelor înseamnă că se transmit mai puține date către un server central, ceea ce reduce riscurile. De asemenea, este mai ușor de “sigilat” un dispozitiv afectat.
În cazul soluțiilor cloud, conectivitatea dispozitivului este obligatorie. Această metodă reduce solicitările privind performanța de procesare locală și facilitează actualizarea sau dezvoltarea algoritmilor în cazul în care aveți mai multe dispozitive. Dezavantajul este că poate genera costuri suplimentare pentru servicii și pot exista riscuri legate de trimiterea de date potențial sensibile în afara locației.
O opțiune intermediară este un sistem de procesare la nivel local lângă hardware-ul IoT, cunoscut uneori sub numele de Edge. În acest caz, mai multe noduri IoT trimit date către un dispozitiv Edge pentru procesare, oferind multe dintre avantajele procesării la nivelul dispozitivului, dar reducând necesitatea ca fiecare nod să aibă o capacitate de calcul de înaltă performanță.
Inteligența artificială de tip ‘Do-it-yourself’
Crearea de aplicații de recunoaștere facială și vocală poate fi realizată cu ajutorul unui computer pe o singură placă, cum ar fi un Raspberry Pi. În cazul recunoașterii faciale, Raspberry Pi poate detecta fețele dintr-o imagine și poate identifica și cartografia în timp real caracteristicile cheie ale acestora, ceea ce îl face ideal pentru aplicațiile de securitate în interior. Farnell a pregătit un kit de componente pentru a facilita crearea de aplicații de recunoaștere facială. Kitul este format din Raspberry Pi 4, camera de înaltă calitate Raspberry Pi și placa Pimoroni Automation HAT.
- Raspberry Pi 4 este un dispozitiv SBC (calculator pe o singură placă) și dispune de un procesor ARM Cortex-A72 quad-core pe 64-biți de 1,5 GHz, Wi-Fi 802.11ac, Bluetooth 5, Ethernet full gigabit, două porturi USB 2.0, două porturi USB 3.0 și suport pentru două monitoare prin intermediul unei perechi de porturi micro Type D HDMI pentru o rezoluție de până la 4K. Pi 4 este alimentat prin intermediul unui port USB-C.
- Camera Raspberry Pi este alcătuită dintr-un senzor Sony IMX477 de 12,3 megapixeli, care se bazează pe arhitectura de senzor cu iluminare din spate, cu backfocus reglabil și suport pentru lentile cu montură C și CS.
- Pimoroni Automation HAT: Preia controlul și monitorizează-ți lumea ‘Automation HAT’ pentru Raspberry Pi! Cu relee, canale analogice, ieșiri alimentate și intrări bufferizate (toate compatibile cu 24V), puteți să conectați simultan o multitudine de accesorii la Raspberry Pi. Este ideal pentru proiecte de casă și de automatizare inteligentă, pentru a vă dota sera cu aspersoare inteligente sau pentru a vă programa hrănirea peștilor!
Imaginile detectate trebuie procesate înainte de a putea fi recunoscute, un exemplu fiind convertirea unei imagini în gri. Un pachet de procesare popular este OpenCV (Open Source Computer Vision Library), care a fost creat pentru a accelera utilizarea percepției automate în produsele comerciale și pentru a oferi o infrastructură comună de aplicații de viziune computerizată.
OpenCV este utilizat în principal pentru operațiuni legate de imagini și oferă asistență pentru funcții precum detectarea fețelor și a caracteristicilor acestora, detectarea formelor precum cercuri și dreptunghiuri într-o imagine și recunoașterea textului în imagini, cum ar fi plăcuțele de înmatriculare. OpenCV este ușor de învățat, funcționează cu aproape toate limbajele principale și poate fi utilizat gratuit.
Un alt kit oferit de Farnell este o cale rapidă de construire a unei case automatizate, bazată pe recunoașterea vocală pentru a controla dispozitivele electrocasnice, cum ar fi luminile, ventilatoarele și televizoarele. Soluția folosește fie un telefon mobil compatibil Alexa, fie un Amazon Echo Dot, și o placă Raspberry Pi 4. Dispozitivul activat de Alexa acceptă comenzi vocale și le folosește pentru a porni sau opri orice aparat electrocasnic prin intermediul unui releu conectat la placa Raspberry Pi. Acest kit virtual include un Raspberry Pi 4 și o placă Pi-relay.
Placa Pi-Relay este varianta preferată pentru controlul dispozitivelor de mare putere, cum ar fi motoarele și luminile. Aceasta vine cu patru relee de înaltă calitate și sarcini de până la 7A/240VAC, care pot funcționa cu dispozitive de uz casnic obișnuite, cum ar fi becuri cu incandescență, diverse lumini LED și ventilatoare. LED-urile incluse pe placă indică starea fiecărui releu, în timp ce un conector cu 40-pini este utilizat pentru a accesa RPi GPIO. Orice sarcină, cum ar fi o lumină, poate fi conectată prin intermediul releului și poate fi controlată cu ajutorul Raspberry Pi 4.
Îmbinarea tuturor elementelor
Furnizând putere de calcul și algoritmi performanți dispozitivelor IoT, AI oferă aplicații avansate de control și securitate pentru utilizatorii casnici, făcându-le viața mai ușoară și mai sigură. Utilizarea unor algoritmi AI ușor de implementat pe un calculator ieftin pe o singură placă (SBC), cum ar fi un Raspberry Pi, este o modalitate ideală pentru a evalua tehnologia și pentru a vă optimiza aplicațiile.
Concluzie
În prezent, este mult mai ușor pentru ingineri și chiar și pentru pasionați să utilizeze algoritmi puternici de inteligență artificială în proiectele lor și nu există un alt domeniu în care acest lucru să fie mai performant decât în aplicațiile IoT și în aplicațiile de automatizare a clădirilor/caselor. Aplicațiile tipice pot include recunoașterea facială pentru deschiderea ușilor sau controlul vocal pentru automatizare. În prezent, aceste tehnologii pot fi implementate cu ușurință pe SBC-uri ieftine și disponibile imediat, cum ar fi Raspberry Pi.
Autor:
Ankur Tomar, Director de marketing tehnic, Farnell
Farnell | ro.farnell.com