Rozpoznawanie twarzy, o ile jest bezpieczne, już teraz stanowi metodę logowania lepszą niż tradycyjne hasła - coś takiego rozwija Microsoft w systemie Windows Hello, a także testuje Google. Osobną sprawą są bazy danych, zawierające nawet miliony zdjęć twarzy. Teoretycznie mogą one służyć dobrym celom, np. akademickim, ale bywają też niebezpieczne, zwłaszcza gdy wspomagają technologie szpiegujące albo naruszają prywatność osób, które nie chcą się w takich bazach znajdować. Do takich kontrowersyjnych przypadków użycia doszło w bazie Microsoftu - MS Celeb.
MS Celeb to w zasadzie treningowy zestaw danych (dataset), zawierający 10 milionów obrazów i służący do rozpoznawania twarzy na zdjęciach. Jak wynika z raportu Financial Times, baza zawierająca milion zdjęć celebrytów stała się problematyczna, bowiem zawierała zdjęcia prawdopodobnie osób prywatnych. Co więcej, zestaw miał być używany przez gigantów technologii, takich jak IBM, Panasonic i Nvidia, a także inne chińskie firmy podejrzane o używanie go do szkolenia swoich technologii szpiegujących.
Gigant z Redmond utworzył MS Celeb w 2016 r., gromadząc zdjęcia z Sieci, udostępnione na licencji Creative Commons. Firma utrzymywała, że MS Celeb to największy tego typu zbiór na świecie. Problem w tym, że trafiły tam zdjęcia osób, których nawet nie tyle status celebryty był wątpliwy, co nigdy nie prosiły, by stać się tego częścią. Microsoft zaprzecza jednak, jakoby baza miała zostać usunięta z powodów związanych z prywatnością. Strona powstała dla celów naukowych - powiedział rzecznik. Była zarządzana przez pracownika, który nie jest już w Microsoft. W momencie, gdy giganci technologii są mocno prześwietlani, a sam Microsoft wzywa do regulacji związanych z rozpoznawaniem twarzy, utrzymywanie takiej bazy online byłoby po prostu niewłaściwe.
MS Celeb przeszedł w tryb offline, ale jego zawartość nie zniknęła całkowicie z Internetu. Jak powiedział Adam Harvey, badacz zaznajomiony z podobnymi, ogromnymi zestawami danych: Ludzie wrzucają go na GitHub, hostują pliki w Dropbox i Baidu Cloud, więc nie ma możliwości powstrzymania ich przed postowaniem go i używaniem do własnych celów.