La câteva luni după ce câțiva oficiali ai companiei au anunțat că Apple le va permite cercetătorilor în domeniul învățării automate și inteligenței artificiale să publice descoperirile lor în lucrări științifice, iată că a apărut și o primă astfel de lucrare. Disponibilă pe site-ul Universității Cornell, lucrarea unui grup de cercetători angajați la Apple ne descrie câteva dintre descoperirile lor în domeniul recunoașterii inteligente a imaginilor.

Intitulată „Învățarea din imagini simulate și nesupravegheate prin antrenare adversarială”, lucrarea descrie un program care poate descifra și înțelege în mod inteligent imaginile digitale. Deși mai avansat, programul descris lucrează într-o manieră foarte similară cu funcționalitățile „Inteligența Siri” și cele de recunoaștere facială introduse de Apple în aplicația Poze din iOS 10.

Angajații companiei americane ne prezintă pentru început dezavantajele și avantajele folosirii de imagini reale comparativ cu cele „sintetice” (imagini de calculator). Unul dintre dezavantajele imaginilor reale ar fi acela că solicită etichetarea manuală a tuturor obiectelor de către personal uman, sarcina fiind descrisă ca „scumpă și risipitoare de timp”. Acest dezavantaj nu îl întâlnim, pe de altă parte, la imaginile generate de computer, întrucât „adnotările sunt automat disponibile” pentru acestea. Totuși, trecerea completă la imagini sintetice ar putea conduce, potrivit oamenilor de la Apple, la o reducere a calității programului în cauză, deoarece „datele sintetice sunt adesea insuficient de realiste”. Prin urmare, un astfel de program ar putea determina foarte bine detaliile din fiecare imagine, dar nu ar putea înțelege și interpreta așa cum trebuie obiectele din lumea reală și imaginile cu care se întâlnește.

Înșirarea de avantaje și dezavantaje duce la ideea principală din lucrare – combinarea de imagini simulate cu cele reale pentru „antrenare adversarială”. Această combinație permite crearea unui program avansat de imagine bazat pe inteligența artificială:

În această lucrare, propunem învățarea Simulată+Nesupravegheată (S+U), unde obiectivul este de a îmbunătăți realismul imaginilor sintetice provenite dintr-un simulator folosind date reale neetichetate. Realismul îmbunătățit permite antrenarea unor tipuri de învățare automată mai bune pe seturi de date mari, fără colectarea datelor sau adnotarea umană.

În restul lucrării sunt prezentate detalii din cercetarea făcută de angajații Apple în acest domeniu, inclusiv experimentele care au fost desfășurate și matematica propusă pentru a susține descoperirile. Tehnologia descrisă se concentrează numai pe imaginile individuale, dar echipa de cercetători a Apple susține că speră ca în curând să poată „învestiga și îmbunătățirea videoclipurilor”.

Cercetătorii creditați pentru descoperirile făcute sunt următorii angajați Apple: Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang și Russ Webb. Lucrarea lor a fost trimisă pe 15 noiembrie, dar nu a fost publicată până pe 22 noiembrie.

Și cum Apple le-a dat inginerilor undă verde să publice lucrări de cercetare, este foarte posibil ca în viitor să vedem multe astfel de lucrări apărute pe Internet pentru a ajuta și alți cercetători.

- Reclamă -