Microsoft, od dawna zaangażowany w rozwój sztucznej inteligencji (AI), wprowadza kolejne innowacje. Firma, która inwestuje miliardy w OpenAI, twórcę ChatGPT, opublikowała nowy patent opisujący system oparty na AI, który przekształca dźwięk na żywo w obrazy. Złożony w kwietniu 2023 roku, dokument szczegółowo opisuje sposób, w jaki system analizuje dźwięk, np. z konferencji czy spotkań, podsumowuje go za pomocą modelu językowego, a następnie generuje odpowiadające mu obrazy.
Funkcja ta prawdopodobnie trafi do Microsoft Teams, gdzie obrazy tworzone w czasie rzeczywistym mogłyby ilustrować wypowiedzi mówców. Zdaniem Microsoftu, takie wizualne wsparcie mogłoby znacząco ułatwić zrozumienie przekazywanych treści, szczególnie osobom uczącym się za pomocą pomocy wizualnych. Pomimo obiecujących perspektyw, należy pamiętać, że opatentowanie technologii nie zawsze oznacza jej natychmiastowe wdrożenie..