Język polski obsługiwany przez neuronową zamianę tekstu na mowę Microsoftu

Język polski obsługiwany przez neuronową zamianę tekstu na mowę Microsoftu

Autor: Krzysztof Sulikowski

Opublikowano: 8/25/2020, 3:20 PM

Liczba odsłon: 3649

Microsoft ogłosił rozszerzenie obsługi języka przez Neuronową zamiana tekstu na mowę (Neural Text to Speech) o 15 nowych głosów. O możliwościach z tego obszaru pisaliśmy już na CentrumXP niejednokrotnie. W skrócie warto przypomnieć, że chodzi o usługi działające w Azure, które "pomagają maszyną mówić jak ludzie". Oparte o głębokie sieci neuronowe systemy potrafią w naturalny sposób rozpoznawać mowę, wykonywać tłumaczenia oraz syntezować głos w oparciu o tekst.

Neuronowa zamiana tekstu na mowę jest częścią Azure Cognitive Services, rodziny usług AI i interfejsów kognitywnych pomocnych w tworzeniu inteligentnych aplikacji. Usługa ta umożliwia konwertowanie tekstu na naturalnie brzmiącą mowę i użycie jej przy tworzeniu przyjaznych dla użytkownika interfejsów aplikacji. Neural TTS sprawdzi się w różnych scenariuszach, np. naturalnie brzmiących asystentów i botów. Firmy, takie jak BBC i Motorola Solutions, używają zamiany tekstu na mowę w Azure, aby rozwijać swoje interfejsy konwersacyjne i asystentów głosowych.

Aby umożliwić większej liczbie deweloperów dodawanie naturalnie brzmiących głosów do ich aplikacji i rozwiązań, na bazie naszej obsługi języków dodajemy dziś 15 nowych głosów Neural TTS wraz ze znaczącymi ulepszeniami jakości głosu.
— Qinying Liao, Microsoft Tech Community

Wśród nowych głosów wymienia się: Salma po arabsku (Egipt), Zariyah po arabsku (Arabia Saudyjska), Alba po katalońsku (Hiszpania), Christel po duńsku (Dania), Neerja po angielsku (Indie), Noora po fińsku (Finlandia), Swara po hindi (Indie), Colette po holendersku (Holandia), Zofia po polsku (Polska), Fernanda po portugalsku (Portugalia), Dariya po rosyjsku (Rosja), Hillevi po szwedzku (Szwecja), Achara po tajsku (Tajlandia), HiuGaai po chińsku (kantoński, tradycyjny) i HsiaoYu po chińsku (tajwański mandaryński). A jak brzmią te głosy? Próbki mowy możecie odsłuchać poniżej.

Kod lokalny

Język

Nazwa głosu

Próbka dźwięku

ar-EG

Arabski (Egipt)

“ar-EG-SalmaNeural”

أتساءل ماذا يمكن ان يحدث لجسمك عندما تأكل الزنجبيل كل يوم لمدة شهر؟

ar-SA

Arabski (Arabia Saudyjska)

“ar-SA-ZariyahNeural”

لديك نصف ساعة فقط؟

ca-ES

Kataloński (Hiszpania)

“ca-ES-AlbaNeural”

L'obra és el retrat d'un moment històric de mobilització popular.

da-DK

Duński (Dania)

“da-DK-ChristelNeural”

Halvfjerds procent af din krop består af vand

en-IN

Angielski (Indie)

“en-IN-NeerjaNeural”

How about coming to the barbecue at the tennis club?

fi-FI

Fiński (Finlandia)

“fi-FI-NooraNeural”

Tavoitteena on lisätä kohtuuhintaisten vuokra-asuntojen määrää kasvukeskuksissa.

hi-IN

Hindi (Indie)

“hi-IN-SwaraNeural”

‘आयरन’ शब्द किस खेल से सम्बन्धित है ?

nl-NL

Niderlandzki (Holandia)

“nl-NL-ColetteNeural”

Alle oceanen zijn met elkaar verbonden en vormen samen één grote massa zout water. 

pl-PL

Polski (Polska)

“pl-PL-ZofiaNeural”

Wyjazd z Poznania planujemy o godzinie czwartej rano.

pt-PT

Portugalski (Portugalia)

“pt-PT-FernandaNeural”

Amanhã vai estar tanto calor que vou à praia.

ru-RU

Rosyjski (Rosja)

“ru-RU-DariyaNeural”

В качестве примера он привел искусственный интеллект, беспилотную технику, генетику, медицину и образование.

sv-SE

Szwedzki (Szwecja)

“sv-SE-HilleviNeural”

Ett kul och intressant avsnitt även för dig som inte var på plats!

th-TH

Tajski (Tajlandia)

“th-TH-AcharaNeural”

เขาทำด้วยหัวใจบริสุทธิ์และต้องการให้ความยุติธรรมแก่ประชาชน

zh-HK

Chiński (kantoński, tradycyjny)

“zh-HK-HiuGaaiNeural”

了解該等基金的三大特點,有助投資者作出更明智的選擇。

zh-TW

Chiński (tajwański mandaryński)

“zh-TW-HsiaoYuNeural”

如果一個人從一所優秀大學畢業,可能意味他有能力做大事。

Źródło: https://azure.microsoft.com/pl-pl/services/cognitive-services/text-to-speech/

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia