KWALIFIKACJA INF10 - STYCZEŃ 2021

PYTANIE NR 25.
W programie typu "test to speech" (TTS) zastosowanie znaczników SSML umożliwia
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
SSML (Speech Synthesis Markup Language) służy do sterowania syntezą mowy: pozwala ustawić, jak ma być odczytany fragment tekstu (np. tempo, pauzy, akcent, intonacja). Nie odpowiada za wygląd tekstu w interfejsie, nie określa formatu pliku wyjściowego i nie jest tym samym co słowniki wymowy.

Pełne wyjaśnienie:

W systemach TTS (Text-to-Speech) tekst jest zamieniany na mowę przez silnik syntezy. Same znaki tekstu często nie wystarczają, aby uzyskać naturalny i czytelny odczyt (np. przy skrótach, liczbach, nagłówkach czy fragmentach wymagających pauzy). Właśnie do tego służą znaczniki SSML (Speech Synthesis Markup Language): pozwalają opisać sposób wypowiadania wybranych fragmentów, np. dodać pauzę, zmienić tempo czy zaakcentować fragment.

Dlatego poprawna jest odpowiedź: "konfigurację sposobu wypowiadania wybranej części tekstu." – jest to zgodne z rolą SSML jako języka znaczników sterującego parametrami mowy.

Pozostałe odpowiedzi są błędne, bo opisują inne mechanizmy:

  • "konfigurację sposobu wyświetlania tekstu w programie." – to domena interfejsu użytkownika (np. ustawień czcionki, kontrastu) lub technologii prezentacji, a nie SSML, które dotyczy dźwięku.
  • "poprawę wymowy za pomocą dedykowanych słowników." – słowniki wymowy mogą istnieć w niektórych silnikach TTS, ale są innym narzędziem niż SSML. SSML nie jest "słownikiem", tylko znacznikiem/strukturą sterującą odczytem.
  • "określenie formatu pliku wyjściowego." – format audio (np. typ kodowania) zależy od ustawień eksportu/konfiguracji usługi, a nie od znaczników opisujących sposób mówienia.

Na egzaminie warto zapamiętać prostą zasadę: SSML = jak to ma zabrzmieć, a nie "jak to ma wyglądać" ani "w czym to ma być zapisane".

Dodatkowe pytania

Dodatkowe pytania (FAQ):
SSML to język znaczników używany do sterowania sposobem, w jaki silnik TTS ma odczytać tekst. Umożliwia m.in. wstawianie pauz, zmianę tempa lub podkreślenie fragmentów, aby mowa była bardziej naturalna i czytelna dla użytkownika.
SSML pozwala opisać, gdzie w odczycie mają pojawić się pauzy oraz jak szybko ma być czytany fragment. Dzięki temu komunikaty, menu czy dłuższe instrukcje mogą być lepiej zrozumiałe, zwłaszcza gdy użytkownik korzysta z TTS przez wiele godzin.
SSML dotyczy warstwy dźwiękowej (syntezy mowy), a wygląd tekstu to sprawa interfejsu programu (np. powiększenie, kontrast, czcionka). W praktyce technik tyfloinformatyk rozdziela te obszary: ustawienia wizualne konfiguruje w UI, a brzmienie w TTS/SSML.
Pośrednio tak: SSML może wymusić sposób odczytu fragmentu (np. literowanie, akcent, odpowiednie pauzy). Nie jest to jednak to samo co "dedykowany słownik wymowy". Słownik to osobny mechanizm, a SSML to opis w tekście sterujący odczytem.
Najczęstszy błąd to utożsamianie SSML z formatowaniem widoku tekstu albo z ustawieniami pliku wynikowego. Warto pamiętać: SSML nie zmienia tego, co widać ani w jakim formacie zapiszesz audio — opisuje tylko, jak ma zabrzmieć odczyt.
Gdy istotna jest czytelność komunikatów: w instrukcjach, materiałach szkoleniowych audio, automatycznych powiadomieniach, opisach formularzy czy odczycie danych (np. numery, skróty). SSML pomaga nadać strukturę i rytm, co zmniejsza zmęczenie słuchowe.
Nie. Format pliku audio (np. typ kodowania, częstotliwość próbkowania) ustawia się zwykle w parametrach usługi lub aplikacji. SSML to warstwa treści: opisuje sposób mówienia (intonacja, pauzy, akcent), a nie parametry techniczne zapisu pliku.
SSML działa "w treści" jako znaczniki sterujące odczytem konkretnego fragmentu. Słownik wymowy działa "globalnie" lub na poziomie reguł silnika, mapując pisownię na wymowę. Na egzaminie klucz: SSML = kontrola wypowiadania fragmentu tekstu.
Umożliwia lepszą strukturę nagrania generowanego z tekstu: sensowne pauzy między akapitami, wyróżnienie ważnych pojęć, czytelne odczytanie list i nagłówków. Dla odbiorcy korzystającego z TTS przekłada się to na mniej pomyłek i szybsze rozumienie treści.
Najlepiej połączyć teorię z praktyką: przeczytać opis SSML w dokumentacji i przetestować odczyt tego samego tekstu bez znaczników i z nimi. W nauce pomagają porównania: ustawienia wyświetlania/format pliku to konfiguracja aplikacji, a SSML to "instrukcja mówienia".
info

To pytanie poprawnie rozwiązuje 48% zdających egzamin. trudne

Według specjalistów z branży: "SSML (Speech Synthesis Markup Language) służy do sterowania syntezą mowy: pozwala ustawić, jak ma być odczytany fragment tekstu (np. tempo, pauzy, akcent, intonacja)."

Źródła:

  • W3C, "Speech Synthesis Markup Language (SSML) Version 1.1", W3C Recommendation, https://www.w3.org/TR/speech-synthesis11/ (dostęp: 2026-03-01)
  • MDN Web Docs, "SSML" (dokumentacja i opis zastosowań), https://developer.mozilla.org/ (wyszukiwanie hasła: SSML) (dostęp: 2026-03-01)
  • Microsoft Learn, "Speech Synthesis Markup Language (SSML)" (Azure AI Speech), https://learn.microsoft.com/ (wyszukiwanie: Speech Synthesis Markup Language SSML) (dostęp: 2026-03-01)

Materiały:

  • Dokumentacja W3C dotycząca SSML (specyfikacja i przykłady)
  • Dokumentacja dostawców silników mowy (Microsoft Azure Speech, Google Cloud Text-to-Speech, Amazon Polly) – sekcje o SSML
  • Materiały dydaktyczne z dostępności cyfrowej dotyczące treści audio i TTS

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego