KWALIFIKACJA INF10 - STYCZEŃ 2021

PYTANIE NR 25.

W programie typu "test to speech" (TTS) zastosowanie znaczników SSML umożliwia

A.	poprawę wymowy za pomocą dedykowanych słowników.
B.	konfigurację sposobu wyświetlania tekstu w programie.
C.	konfigurację sposobu wypowiadania wybranej części tekstu.
D.	określenie formatu pliku wyjściowego.
	Zostaw bez odpowiedzi

Wyjaśnienie poprawnej odpowiedzi:
SSML (Speech Synthesis Markup Language) służy do sterowania syntezą mowy: pozwala ustawić, jak ma być odczytany fragment tekstu (np. tempo, pauzy, akcent, intonacja). Nie odpowiada za wygląd tekstu w interfejsie, nie określa formatu pliku wyjściowego i nie jest tym samym co słowniki wymowy.

Pełne wyjaśnienie:

W systemach TTS (Text-to-Speech) tekst jest zamieniany na mowę przez silnik syntezy. Same znaki tekstu często nie wystarczają, aby uzyskać naturalny i czytelny odczyt (np. przy skrótach, liczbach, nagłówkach czy fragmentach wymagających pauzy). Właśnie do tego służą znaczniki SSML (Speech Synthesis Markup Language): pozwalają opisać sposób wypowiadania wybranych fragmentów, np. dodać pauzę, zmienić tempo czy zaakcentować fragment.
Dlatego poprawna jest odpowiedź: "konfigurację sposobu wypowiadania wybranej części tekstu." – jest to zgodne z rolą SSML jako języka znaczników sterującego parametrami mowy.
Pozostałe odpowiedzi są błędne, bo opisują inne mechanizmy:
"konfigurację sposobu wyświetlania tekstu w programie." – to domena interfejsu użytkownika (np. ustawień czcionki, kontrastu) lub technologii prezentacji, a nie SSML, które dotyczy dźwięku.
"poprawę wymowy za pomocą dedykowanych słowników." – słowniki wymowy mogą istnieć w niektórych silnikach TTS, ale są innym narzędziem niż SSML. SSML nie jest "słownikiem", tylko znacznikiem/strukturą sterującą odczytem.
"określenie formatu pliku wyjściowego." – format audio (np. typ kodowania) zależy od ustawień eksportu/konfiguracji usługi, a nie od znaczników opisujących sposób mówienia.
Na egzaminie warto zapamiętać prostą zasadę: SSML = jak to ma zabrzmieć, a nie "jak to ma wyglądać" ani "w czym to ma być zapisane".

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Co to jest SSML w syntezie mowy TTS?

SSML to język znaczników używany do sterowania sposobem, w jaki silnik TTS ma odczytać tekst. Umożliwia m.in. wstawianie pauz, zmianę tempa lub podkreślenie fragmentów, aby mowa była bardziej naturalna i czytelna dla użytkownika.

Jak SSML wpływa na tempo i pauzy w odczycie tekstu?

SSML pozwala opisać, gdzie w odczycie mają pojawić się pauzy oraz jak szybko ma być czytany fragment. Dzięki temu komunikaty, menu czy dłuższe instrukcje mogą być lepiej zrozumiałe, zwłaszcza gdy użytkownik korzysta z TTS przez wiele godzin.

Dlaczego SSML nie służy do ustawiania wyglądu tekstu na ekranie?

SSML dotyczy warstwy dźwiękowej (syntezy mowy), a wygląd tekstu to sprawa interfejsu programu (np. powiększenie, kontrast, czcionka). W praktyce technik tyfloinformatyk rozdziela te obszary: ustawienia wizualne konfiguruje w UI, a brzmienie w TTS/SSML.

Czy SSML może poprawiać wymowę skrótów i liczb?

Pośrednio tak: SSML może wymusić sposób odczytu fragmentu (np. literowanie, akcent, odpowiednie pauzy). Nie jest to jednak to samo co "dedykowany słownik wymowy". Słownik to osobny mechanizm, a SSML to opis w tekście sterujący odczytem.

Jakie błędy najczęściej popełnia się w pytaniach o SSML na egzaminie?

Najczęstszy błąd to utożsamianie SSML z formatowaniem widoku tekstu albo z ustawieniami pliku wynikowego. Warto pamiętać: SSML nie zmienia tego, co widać ani w jakim formacie zapiszesz audio — opisuje tylko, jak ma zabrzmieć odczyt.

Kiedy warto używać SSML w narzędziach dla osób niewidomych?

Gdy istotna jest czytelność komunikatów: w instrukcjach, materiałach szkoleniowych audio, automatycznych powiadomieniach, opisach formularzy czy odczycie danych (np. numery, skróty). SSML pomaga nadać strukturę i rytm, co zmniejsza zmęczenie słuchowe.

Czy SSML określa format pliku wyjściowego w TTS?

Nie. Format pliku audio (np. typ kodowania, częstotliwość próbkowania) ustawia się zwykle w parametrach usługi lub aplikacji. SSML to warstwa treści: opisuje sposób mówienia (intonacja, pauzy, akcent), a nie parametry techniczne zapisu pliku.

Jak odróżnić SSML od słownika wymowy w TTS?

SSML działa "w treści" jako znaczniki sterujące odczytem konkretnego fragmentu. Słownik wymowy działa "globalnie" lub na poziomie reguł silnika, mapując pisownię na wymowę. Na egzaminie klucz: SSML = kontrola wypowiadania fragmentu tekstu.

Jak SSML pomaga w przygotowaniu dostępnych materiałów edukacyjnych?

Umożliwia lepszą strukturę nagrania generowanego z tekstu: sensowne pauzy między akapitami, wyróżnienie ważnych pojęć, czytelne odczytanie list i nagłówków. Dla odbiorcy korzystającego z TTS przekłada się to na mniej pomyłek i szybsze rozumienie treści.

Jak przygotować się do pytań o TTS i SSML w INF.10?

Najlepiej połączyć teorię z praktyką: przeczytać opis SSML w dokumentacji i przetestować odczyt tego samego tekstu bez znaczników i z nimi. W nauce pomagają porównania: ustawienia wyświetlania/format pliku to konfiguracja aplikacji, a SSML to "instrukcja mówienia".

info

To pytanie poprawnie rozwiązuje 48% zdających egzamin. trudne

Według specjalistów z branży: "SSML (Speech Synthesis Markup Language) służy do sterowania syntezą mowy: pozwala ustawić, jak ma być odczytany fragment tekstu (np. tempo, pauzy, akcent, intonacja)."

Źródła:

W3C, "Speech Synthesis Markup Language (SSML) Version 1.1", W3C Recommendation, https://www.w3.org/TR/speech-synthesis11/ (dostęp: 2026-03-01)
MDN Web Docs, "SSML" (dokumentacja i opis zastosowań), https://developer.mozilla.org/ (wyszukiwanie hasła: SSML) (dostęp: 2026-03-01)
Microsoft Learn, "Speech Synthesis Markup Language (SSML)" (Azure AI Speech), https://learn.microsoft.com/ (wyszukiwanie: Speech Synthesis Markup Language SSML) (dostęp: 2026-03-01)

Materiały:

Dokumentacja W3C dotycząca SSML (specyfikacja i przykłady)
Dokumentacja dostawców silników mowy (Microsoft Azure Speech, Google Cloud Text-to-Speech, Amazon Polly) – sekcje o SSML
Materiały dydaktyczne z dostępności cyfrowej dotyczące treści audio i TTS

Aktualizacja pytania: 31.03.2026

LOGOWANIE

KWALIFIKACJA INF10 - STYCZEŃ 2021

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Zobacz też: