Zazwyczaj potrafimy trafnie odczytać emocje na twarzy innego człowieka. O ile nie jesteśmy wytrawnymi pokerzystami, nasza twarz zdradza nasz nastrój. Ludzie radzą sobie z tym całkiem nieźle, ale maszyny? Niekoniecznie... Aż do dzisiaj. Wykorzystując technologię machine learning i sztuczną inteligencję, inżynierowie opracowują dziś aplikacje, które rozpoznają dźwięki, słowa, obrazy, a nawet wyraz twarzy. Co więcej, wybrane funkcje maszynowego uczenia, oparte na chmurze Microsoftu, są dostępne także dla mniej zaawansowanych programistów.
Wesoły, smutny czy zły? Nowa aplikacja zespołu Microsoft Project Oxford z dużą dokładnością oceni twój nastrój. Narzędzie (które najwyraźniej nie ma jeszcze nazwy) zostało po raz pierwszy zaprezentowane na brytyjskiej konferencji Future Decoded. Na scenie pojawił się Chris Bishop, głowa zespołu Microsoft Research Cambridge. Aplikacja trafnie odczytała "szczęście" na jego twarzy. Inne kategorie emocji to: neutralność, zaskoczenie, smutek, złość, obrzydzenie, strach i pogarda. Wyniki obliczeń prezentowane są niejako w paskach postępu, co nie tylko podkreśla maszynowe rozumienie emocji, ale też nawiązuje choćby do serii gry The Sims. Wyniki podawane są w skali od 0 (brak danej emocji) do 1 (emocja jest wyraźna) z dokładnością do pięciu miejsc po przecinku.
Wiosną tego roku Microsoft przedstawił kilka narzędzi, opartych na maszynowym uczeniu. Swoje pięć minut miało już zgadywanie wieku (How-Old.net) i porównywanie twarzy (TwinsOrNot.net). Były to dość proste aplikacje webowe, oparte jednak na potężnej technologii analitycznej. Sztuczna inteligencja opiera się na danych ilościowych. Materiał z fotografii traktowany jest odpowiednimi algorytmami z funkcją uczenia się, a następnie porównywany z wzorcowymi i wcześniejszymi przykładami. Im więcej takich prób, tym inteligentniejsza staje się sztuczna inteligencja. Tak pokrótce można wyjaśnić technologię machine learning, z której korzystają też natywne aplikacje Microsoftu, takie jak Cortana i Skype Translator.
Narzędzie jest już dostępne dla deweloperów jako publiczna beta. Pod koniec tego roku Microsoft udostępni jeszcze kilka podobnych narzędzi, takich jak inteligentna autokorekta, program do edycji wideo, bliźniaczy z Microsoft Hyperlapse, rozpoznawanie mówcy na podstawie indywidualnej barwy głosu czy dykcji, inteligentniejsze rozpoznawanie mowy w trudnym otoczeniu, a także zaktualizowane API rozpoznawania twarzy. Wszystkie z nich będą udostępnione jako bezpłatne wersje z ograniczeniami czasowymi.