Poate un calculator să se învețe bunul simț?
În trecutul nu prea îndepărtat, sugerarea că un computer ar putea demonstra „bunul simț” ar fi considerată un oximoron. Dar supercomputerele, cum ar fi Watson IBM, pot prezice noi roluri pentru computere.În prezent, cercetătorii de la Universitatea Carnegie Mellon rulează un program de calculator 24/7, într-un efort de a capta date și de a-și învăța bunul simț la scară masivă.
Programul se numește Never Ending Image Learner (NEIL), deoarece software-ul caută imagini pe web, făcând tot posibilul să le înțeleagă singure și, pe măsură ce construiește o bază de date vizuală în creștere, adunând bunul simț pe o scară masivă.
NEIL valorifică progresele recente în viziunea computerizată, care permit programelor de computer să identifice și să eticheteze obiecte în imagini, să caracterizeze scene și să recunoască atribute, cum ar fi culorile, iluminatul și materialele, toate cu un minim de supraveghere umană.
La rândul lor, datele pe care le generează vor spori și mai mult capacitatea computerelor de a înțelege lumea vizuală.
NEIL are progrese semnificative față de dispozitivele robotice anterioare, deoarece poate face asocieri între lucruri pentru a obține informații de bun simț. Informații pe care oamenii le cunosc aproape intuitiv - că mașinile se găsesc adesea pe drumuri, că clădirile tind să fie verticale și că rațele arată ca niște gâște.
Pe baza referințelor textului, s-ar putea părea că culoarea asociată cu oile este neagră, dar oamenii - și acum NEIL - știu totuși că oile sunt de obicei albe.
„Imaginile sunt cel mai bun mod de a învăța proprietățile vizuale”, a spus Abhinav Gupta, dr., Profesor asistent de cercetare la Institutul de Robotică Carnegie Mellon.
„Imaginile includ, de asemenea, o mulțime de informații de bun simț despre lume. Oamenii învață acest lucru de la sine și, cu NEIL, sperăm că și computerele vor face acest lucru. ”
Un cluster de calculatoare rulează programul NEIL de la sfârșitul lunii iulie și a analizat deja trei milioane de imagini, identificând 1.500 de tipuri de obiecte într-o jumătate de milion de imagini și 1.200 de tipuri de scene în sute de mii de imagini.
A conectat punctele pentru a învăța 2.500 de asociații din mii de cazuri.
O motivație pentru proiectul NEIL este de a crea cea mai mare bază de cunoștințe structurate vizuale din lume, în care obiectele, scenele, acțiunile, atributele și relațiile contextuale sunt etichetate și catalogate.
„Ceea ce am învățat în ultimii 5-10 ani de cercetare a viziunii pe computer este că, cu cât aveți mai multe date, cu atât devine mai bună viziunea pe computer”, a spus Gupta.
Unele proiecte, precum ImageNet și Visipedia, au încercat să compileze aceste date structurate cu asistență umană.
Dar amploarea internetului este atât de vastă - doar Facebook deține peste 200 de miliarde de imagini - încât singura speranță de a analiza totul este de a învăța computerele să o facă în mare măsură singure.
De asemenea, oamenii îi spun NEIL ce categorii de obiecte, scene etc., de căutat și analizat. Dar uneori, ceea ce găsește NEIL poate surprinde chiar și cercetătorii.
Se poate anticipa, de exemplu, că o căutare a „mărului” ar putea întoarce imagini de fructe, precum și computere laptop. Dar Gupta și echipa sa, toți gospodari, nu aveau nicio idee că o căutare a F-18 ar identifica nu numai imaginile unui avion de luptă, ci și catamaranele din clasa F18.
Pe măsură ce continuă căutarea, NEIL dezvoltă subcategorii de obiecte - tricicletele pot fi pentru copii, pentru adulți și pot fi motorizate, sau mașinile vin într-o varietate de mărci și modele.
Și începe să observe asocieri - că zebrele tind să se găsească în savane, de exemplu, și că etajele de tranzacționare a acțiunilor sunt de obicei aglomerate.
Înainte ca NEIL să devină un nume de uz casnic, scara va trebui redusă, deoarece NEIL este intens din punct de vedere al calculului, programul rulând pe două clustere de computere care includ 200 de nuclee de procesare.
Sursa: Universitatea Carnegie Mellon