Pojęć związanych z AI używa się w informatyce od lat 50. ubiegłego wieku, ale wiele osób spotkało się z nimi dopiero w ciągu ostatniego roku. To dlatego, że dzięki przełomom w rozwoju sztuczna inteligencja stała się ona powszechnie dostępna, a wręcz namacalna za sprawą takich produktów, jak ChatGPT, Bing Chat, Microsoft 365 Copilot czy DALLE-3. Coś, co było wcześniej technicznym żargonem, w ostatnich miesiącach przeszło do publicznego dyskursu. Wiele tych pojęć brzmi znajomo, aczkolwiek ich dokładne znaczenie może być niejasne. W poniższym artykule możesz zapoznać się z najważniejszą terminologią związaną z AI, aby poruszać się sprawnie w tym obszarze.
Spis treści
- Sztuczna inteligencja
- Machine Learning
- Duże modele językowe
- Generatywna sztuczna inteligencja
- Halucynacje
- Odpowiedzialna sztuczna inteligencja
- Modele multimodalne
- Prompty
- Copiloty
- Pluginy
1. Sztuczna inteligencja
Sztuczna inteligencja (SI) to w zasadzie superinteligentny system komputerowy, który w pewien sposób umie naśladować ludzi — na przykład rozumiejąc, co ludzie mówią, podejmując decyzje, tłumacząc na różne języki, analizując, czy coś jest pozytywne czy negatywne, a nawet ucząc się na własnych doświadczeniach. AI (Artificial Intelligence) nazywana jest sztuczną inteligencją, ponieważ została stworzona przez człowieka przy pomocy technologii.
Czasem można usłyszeć, że systemy sztucznej inteligencji mają cyfrowe mózgi, ale nie są to fizyczne maszyny ani roboty. To po prostu programy uruchamiane na komputerach — zwykle na serwerach w centrach danych, choć w pewnym zakresie AI może działać lokalnie, nawet na Twoim telefonie. Wymaga ona jednak sporej mocy obliczeniowej. Czasem dokonujemy interakcji z AI bezpośrednio, na przykład pisząc na czacie z Copilotem albo wydając mu polecenia w Windows i aplikacjach Microsoft 365. Najczęściej jednak sztuczna inteligencja pozostaje niezauważalna i działa w tle, tworząc rekomendacje muzyczne, podpowiadając słowa, gdy piszemy wiadomość w Outlooku, albo skanując aktywność w sieci w poszukiwaniu złośliwego oprogramowania.
2. Machine Learning
Jeśli sztuczna inteligencja jest celem, to machine learning (ML) jest drogą do tego celu. Uczenie maszynowe to dziedzina informatyki pod egidą AI, w której ludzie uczą systemy komputerowe, jak coś zrobić, poprzez identyfikację wzorów i prognozowanie w oparciu o nie. Dane po wielokroć przechodzą przez algorytmy, za każdym razem z różnymi danymi wejściowymi (inputami) i feedbackiem, aby system uczył się i ulepszał w procesie trenowania. To tak jak powtarzać skale na pianinie 10 milionów razy.
Uczenie maszyn jest szczególnie przydatne w problemach, które bez niego byłyby trudne lub niemożliwe do rozwiązania przy pomocy tradycyjnych technik programistycznych. To m.in. rozpoznawanie obrazów i tłumaczenie języków. Wymagają one olbrzymich ilości danych i w ostatnich latach mogliśmy zaobserwować przełomy w tym obszarze, jak choćby w tłumaczeniu maszynowym. Popularne translatory, odkąd wykorzystano w nich sieci neuronowe, tłumaczą o wiele płynniej, a ich outputy (to, co z nich wychodzi) brzmią bardzo naturalnie. Ostatnim dużym wydarzeniem było pojawienie się na scenie ChatGPT i Bing Chat/Copilot — czatbotów opartych na dużych modelach językowych (LLM), które korzystają właśnie z machine learningu. Podkategorią maszynowego uczenia jest głębokie uczenie (deep learning), które zajmuje się tworzeniem głębokich sieci neuronowych.
3. Duże modele językowe
Large Language Models (LLMs) to modele sztucznej inteligencji, które korzystają z technik uczenia maszynowego, aby przetwarzać język i naśladować to, jak komunikują się ludzie. Opierają się one na sieciach neuronowych (neural networks — NNs), które są systemami komputerowymi o budowie inspirowanej ludzkim mózgiem. Składają się z węzłów i połączeń symulujących neurony i synapsy. Zostały wytrenowane na olbrzymich ilościach tekstu, aby nauczyć się wzorców oraz relacji w języku i dzięki temu używać języka zrozumiałego dla ludzi.
Umiejętności rozwiązywania problemów pozwalają korzystać z LLMs do tłumaczenia języków, odpowiadania na pytania w formie czatbota, podsumowywania tekstów, a nawet pisania wierszy, opowiadań i kodu programistycznego. Duże modele językowe nie mają myśli ani uczuć, ale czasami mogą brzmieć, jakby miały, ponieważ nauczyły się wzorów, które pomagają im odpowiadać w sposób, w jaki mogliby odpowiadać ludzie. Są zwykle dostrajane przez programistów z użyciem procesu zwanego uczeniem przez wzmacnianie na podstawie informacji zwrotnych od ludzi (Reinforcement learning from human feedback — RLHF), aby brzmiały bardziej konwersacyjnie.
4. Generatywna sztuczna inteligencja
Generatywna sztuczna inteligencja (Generative AI) korzysta z mocy dużych modeli językowych, aby tworzyć nowe rzeczy, a nie tylko dostarczać informacje o rzeczach już istniejących. Uczy się ona wzorów i struktur, a następnie generuje coś, co może wyglądać znajomo, ale jest nowe. Potrafi ona tworzyć treści, takie jak obrazy, muzyka, tekst, wideo i kod. Możesz jej używać do tworzenia sztuki, pisania historii, designu produktów, a nawet jako pomoc w zadaniach administracyjnych.
Generatywna AI ma też swoją ciemną stronę. Za jej pomocą osoby o złych zamiarach tworzą fake newsy i deep fake'i, czyli obrazy lub wideo, które wyglądają jak prawdziwe, ale zawierają nieprawdziwe treści. Może być to szczególnie opłakane w skutkach, gdy na takim zdjęciu czy nagraniu znajduje się np. znany polityk. Na szczęście czołowi twórcy AI pracują nad sposobami jasnej identyfikacji treści stworzonych przez AI (AI-generated content), a także mają wprowadzone ograniczenia, które nie pozwalają generować zawartości uznawanej za szkodliwą lub obraźliwą.
5. Halucynacje
Sztuczna inteligencja nie ma ludzkiej świadomości, a jednak zdarza jej się halucynować. Co to właściwie znaczy? Systemy generatywnej AI mogą tworzyć historie, wiersze i piosenki, ale czasem chcemy wyników opartych na prawdzie. Jako że te systemy nie potrafią jeszcze odróżnić faktów od fikcji, mogą dawać nietrafne odpowiedzi, które deweloperzy nazywają halucynacjami lub fabrykacjami. To tak, jakby ktoś doszukał się zarysu twarzy na Księżycu i powiedział, że na Księżycu znajduje się człowiek.
Deweloperzy starają się rozwiązać te problemy poprzez umocowanie/osadzenie/uziemienie (grounding), dostarczając systemowi AI dodatkowych informacji z zaufanych źródeł, aby poprawić trafność odpowiedzi na dany temat. Czasami przewidywania systemu także są mylne, jeśli model nie posiadł bieżącej informacji po tym, jak został wytrenowany. Nie należy więc w 100% ufać temu, co wychodzi z czatbota. Często jednak pod jego odpowiedziami znajdują się linki do źródeł, które można kliknąć, aby sprawdzić dane informacje.
6. Odpowiedzialna sztuczna inteligencja
Odpowiedzialna sztuczna inteligencja to podejście, które Microsoft obrał już wiele lat temu. Ma ono na celu projektowanie systemów AI, które są bezpieczne i uczciwe na każdym poziomie, wliczając w to model uczenia maszynowego, oprogramowanie, interfejs użytkownika oraz zasady i ograniczenia. To niezwykle ważny element, ponieważ systemy AI zwykle pomagają ludziom podejmować ważne decyzje dotyczące osób, np. w obszarach edukacji i zdrowia.
Ponieważ jednak systemy AI zostały stworzone przez ludzi i wytrenowane na danych z nieidealnego świata, mogą one odzwierciedlać stronniczość czy też subiektywne punkty widzenia. Istotną częścią odpowiedzialnej AI jest rozumienie danych użytych do trenowania systemu i znajdowanie lepszych sposobów na przezwyciężenie wad, aby systemy te lepiej odzwierciedlały całe społeczeństwo, a nie tylko wybrane grupy ludzi.
7. Modele multimodalne
Model multimodalny (multimodal model) to taki, który potrafi jednocześnie pracować z różnymi typami lub trybami (modes) danych. Może on patrzeć na zdjęcia, słuchać dźwięków i czytać słowa. To prawdziwy mutlitasker! Może on łączyć wszystkie te informacje, aby robić takie rzeczy, jak odpowiadanie na pytania dotyczące obrazów. To potrafi np. Copilot (dawniej Czat Bing), któremu możesz wrzucić obraz (zdjęcie, grafikę czy nawet mema) i zadawać dotyczące go pytania, np. "dlaczego ten mem jest śmieszny?".
8. Prompty
Prompty (prompts) to instrukcje wprowadzane do systemu w języku, kodzie lub jako obrazy, które mówią AI, jakie zadanie ma wykonać. Inżynierowie — ale też wszyscy, którzy dokonują interakcji z AI — powinni ostrożnie projektować prompty, aby uzyskiwać pożądane wyniki od dużych modeli językowych.
To jak z zamawianiem jedzenia przy barze: nie prosisz po prostu o kanapkę, ale mówisz, jakie wybierasz pieczywo, składniki i dodatki. Co jednak ciekawe, do interfejsów AI możesz wprowadzać bardzo ogólne dane, zahaczające tylko pobieżnie lub w nietypowy sposób o właściwy temat, a sztuczna inteligencja może załapać, o co Ci chodzi, i w razie potrzeby poprosić Cię o doprecyzowanie. Od paru lat widzimy, jak wyszukiwarki internetowe radzą sobie coraz lepiej w rozpoznawaniu intencji użytkownika. Nie inaczej jest z dzisiejszymi aplikacjami AI, takimi jak Copilot.
9. Copiloty
Copilot jest jak osobisty asystent, który towarzyszy Ci w różnych aplikacjach, pomagając Ci pisać, programować, podsumowywać, wyszukiwać i podejmować decyzje. Rozumie on mnóstwo rodzajów danych. Ostatnie osiągnięcia w dużych modelach językowych umożliwiły powstawanie copilotów (pisanych z małej litery, także w liczbie mnogiej jako rodzaj oprogramowania, a niekoniecznie jako Microsoft Copilot), pozwalając im pojmować naturalny język ludzki i dostarczać odpowiedzi, tworzyć content lub podejmować działania w różnych aplikacjach.
Copiloty tworzone są w oparciu o zasady odpowiedzialnej AI, aby były bezpieczne i używane w dobrej wierze. Podobnie jak drugi pilot w samolocie, copilot nie obejmuje dowodzenia — tylko Ty — i jest raczej narzędziem, które pomaga Ci być bardziej produktywnym i wydajnym. Udostępniona niedawno platforma Microsoft Copilot Studio umożliwia dostosowywanie Copilota w Microsoft 365 i tworzenie samodzielnych copilotów w podejściu low-code.
10. Pluginy
Pluginy, czyli wtyczki (czasem też dodatki i rozszerzenia), znamy dobrze z aplikacji Office czy przeglądarek internetowych. Na podobnej zasadzie działają one w systemach sztucznej inteligencji, rozszerzając jej możliwości i pozwalając Ci robić więcej rzeczy bez potrzeby modyfikowania bazowego modelu.
Pluginy pozwalają copilotom dokonywać interakcji z innymi usługami i programami - na przykład otwierać aplikacje Adobe w Windows Copilot. Mogą pomagać systemom AI w dostępie do nowych informacji, wykonywaniu skomplikowanych obliczeń matematycznych czy porozumiewaniu się z innymi programami. Dzięki nim systemy AI są potężniejsze, łącząc się z resztą cyfrowego świata.
Źródło: Microsoft, opracowanie własne