Bing świetnie sobie radzi z rozpoznawaniem zawartości obrazów

Bing świetnie sobie radzi z rozpoznawaniem zawartości obrazów

Autor: Krzysztof Sulikowski

Opublikowano: 6/26/2023, 5:20 PM

Liczba odsłon: 1482

W zeszłym tygodniu pisaliśmy o wczesnej implementacji rozpoznawania zawartości obrazów na Czacie Bing. W ostatnich dniach kolejni użytkownicy zgłaszają, że także oni mogą przesyłać obrazy jako prompty, a także dzielą się wynikami. GPT-4 w imponujący sposób interpretuje dane niezależnie od tego, czy są to zdjęcia, memy, równania matematyczne czy tabele.

Od niedawna Czat Bing akceptuje obrazy jako dane wejściowe, choć dostępność tej funkcji jest ograniczona. W zeszłym tygodniu przyglądaliśmy się przykładowi mema, który sztuczna inteligencja trafnie zinterpretowała i wykazała się poczuciem humoru. Czas na przykłady od kolejnych testerów.

Bing świetnie sobie radzi z rozpoznawaniem zawartości obrazów

𝑨𝒓𝒕𝒊𝒇𝒊𝒄𝒊𝒂𝒍 𝑮𝒖𝒚 przesłał zdjęcie równania i poprosił Bing, aby je opisał. Bing prawidłowo rozpoznał Równanie Schrödingera i zamieścił jego opis.

Bing świetnie sobie radzi z rozpoznawaniem zawartości obrazów

Kolejnym przykładem podzielił się Karsten Lehmann, który wrzucił do Czatu Bing obraz i prośbę/pytanie: "Wyjaśnij mi ten obraz i przetłumacz tekst. Czy to miał być żart?". Bing wyjaśnił, że obraz przedstawia tabelę z niektórymi przykładami użycia wielkich i małych liter w języku angielskim. Tekst jest napisany po niemiecku i podzielony na dwie kolumny, z których lewa pokazuje przykłady prawidłowego użycia, a prawa kolumna — nieprawidłowego. Dalej znalazły się kolejne wyjaśnienia niemieckiej gramatyki, tłumaczenie tekstu z formatowaniem tabeli i pogrubieniami oraz wreszcie odpowiedź, czy ten obraz można uznać za żart.

Bing świetnie sobie radzi z rozpoznawaniem zawartości obrazów

Ostatni przykład tego samego autora to już dość proste zadanie: "Co się znajduje na tym zdjęciu?" z dołączonym zdjęciem Świątyni w Edfu w Egipcie. Proste, bo od dawna radzą sobie z nim klasyczne wyszukiwarki grafiki, takie jak Google i Bing. Rozpoznawanie zawartości zdjęć (Computer Vision) także nie jest nowością. Już kilka lat temu było dostępne w aplikacjach takich jak Seeing AI czy jako usługa poznawcza w Azure. Nigdy jednak wcześniej ta funkcjonalność nie była tak bardzo na wyciągnięcie ręki dla zwykłego użytkownika.

Źródło: https://twitter.com/Klehmann79/status/1672369849983541249

Źródło: https://twitter.com/Klehmann79/status/1672369849983541249

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia