KWALIFIKACJA INF10 - STYCZEŃ 2015

Q: Jak odpowiadać na pytania egzaminacyjne o SAPI i screen readery?

Najpierw ustal, czy pytanie dotyczy komunikacji między programami, czy jakości językowej mowy. SAPI kojarz z interfejsem/standardem API. Unikaj odpowiedzi opisujących "poprawne czytanie" znaków lub liczb, bo to zwykle rola TTS i ustawień.

PYTANIE NR 26.

Standard SAPI umożliwia

A.	poprawne odczytywanie znaków narodowych przez program udźwiękawiający.
B.	poprawne odczytywanie liczb w systemie dziesiętnym przez program udźwiękawiający.
C.	komunikację pomiędzy programem udźwiękawiającym a programowym syntezatorem mowy.
D.	komunikację pomiędzy programem udźwiękawiającym a każdym syntezatorem mowy.
	Zostaw bez odpowiedzi

Wyjaśnienie poprawnej odpowiedzi:
SAPI (Speech API) to warstwa pośrednia/standard komunikacji, dzięki której aplikacja (np. program udźwiękawiający) może korzystać z funkcji syntezatora mowy. Nie gwarantuje "poprawnego odczytu" liczb ani znaków narodowych sama w sobie, ani współpracy z absolutnie każdym syntezatorem – wymagana jest zgodność z SAPI.

Pełne wyjaśnienie:

SAPI (Speech API) należy rozumieć jako interfejs (API) umożliwiający komunikację pomiędzy oprogramowaniem, które chce "mówić", a komponentem realizującym mowę, czyli syntezatorem mowy (TTS). W praktyce program udźwiękawiający lub inna aplikacja wysyła tekst oraz parametry (np. tempo, głośność, wybór głosu) do silnika mowy poprzez uzgodniony mechanizm. Dzięki temu możliwa jest wymiana syntezatora bez zmiany logiki działania aplikacji, o ile oba elementy obsługują ten sam standard.
Odpowiedź "komunikację pomiędzy programem udźwiękawiającym a programowym syntezatorem mowy" jest poprawna, bo opisuje istotę SAPI: pośredniczenie w połączeniu aplikacji z silnikiem TTS i ujednolicanie sposobu wywoływania funkcji mowy.
Pozostałe propozycje są błędne z typowych powodów:
"poprawne odczytywanie liczb w systemie dziesiętnym" – to nie jest rola standardu komunikacji. To, jak liczby są interpretowane i wypowiadane, zależy od reguł językowych, ustawień, a często od samego syntezatora i aplikacji, nie od istnienia API.
"poprawne odczytywanie znaków narodowych" – również nie jest gwarantowane przez sam interfejs. Kluczowe są kodowanie tekstu, obsługa języka oraz jakość i ustawienia silnika TTS. Interfejs jedynie przenosi dane i polecenia.
"komunikację … z każdym syntezatorem mowy" – sformułowanie "każdym" jest zbyt szerokie. Standardy zapewniają współpracę w zakresie zgodności (np. syntezator zgodny z danym API), a nie z dowolnym, nieobsługującym danego interfejsu rozwiązaniem.
W kontekście pracy technika tyfloinformatyka warto zapamiętać praktyczną zasadę: gdy aplikacja "widzi" tylko część głosów lub nie wykrywa syntezatora, częstą przyczyną jest brak zgodności lub brak właściwego interfejsu/sterownika, a nie "błąd w czytaniu liter".

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Co to jest SAPI w kontekście syntezy mowy?

SAPI to interfejs (Speech API), który ujednolica sposób, w jaki program może sterować syntezatorem mowy. Dzięki temu aplikacja przekazuje tekst i parametry mówienia do silnika TTS w przewidywalny, "standardowy" sposób.

Jak SAPI łączy program udźwiękawiający z syntezatorem mowy?

SAPI działa jak warstwa pośrednia: screen reader wysyła do API tekst i polecenia (np. pauza, tempo), a syntezator zgodny z SAPI odbiera je i generuje mowę. Bez wspólnego interfejsu integracja bywa trudniejsza lub niemożliwa.

Dlaczego SAPI nie gwarantuje poprawnego czytania liczb?

SAPI określa sposób komunikacji, a nie reguły językowe wypowiadania treści. To syntezator mowy i ustawienia języka decydują, jak przeczytać liczby, skróty czy daty. API jedynie przenosi tekst i komendy między programami.

Czy każdy syntezator mowy działa z SAPI?

Nie. Działa tylko taki syntezator, który ma obsługę zgodną z SAPI (np. odpowiedni komponent/sterownik). "Standard" nie oznacza współpracy z każdym rozwiązaniem na rynku, tylko z tymi, które implementują dany interfejs.

Jakie są typowe objawy braku zgodności SAPI z TTS?

Często syntezator nie pojawia się na liście głosów w programie, program nie potrafi rozpocząć mówienia albo działa tylko częściowo. W praktyce warto sprawdzić wersję komponentów, poprawność instalacji oraz to, czy TTS udostępnia głosy przez SAPI.

Co to jest program udźwiękawiający i jak współpracuje z TTS?

Program udźwiękawiający (screen reader) zbiera informacje z interfejsu systemu i aplikacji, a następnie przekazuje je do syntezatora mowy. Współpraca bywa realizowana przez API (np. SAPI), które ułatwia sterowanie mową i wybór dostępnych głosów.

Jak odróżnić problem z SAPI od problemu z językiem syntezatora?

Jeśli program w ogóle nie "widzi" głosu lub nie potrafi rozpocząć mówienia, to częściej problem integracji/zgodności (interfejs). Jeśli mówi, ale błędnie czyta znaki lub odmianę, to częściej kwestia języka, głosu i ustawień TTS.

Kiedy technik tyfloinformatyk spotka się z SAPI w praktyce?

Podczas instalacji i konfiguracji mowy w Windows, doboru silnika TTS dla użytkownika niewidomego, testów kompatybilności screen readera z głosami oraz przy diagnozowaniu sytuacji, gdy aplikacja nie potrafi korzystać z syntezatora.

Jakie inne elementy wpływają na jakość odczytu poza SAPI?

Znaczenie mają: jakość samego głosu TTS, obsługa języka polskiego, ustawienia szybkości i intonacji, słowniki wymowy, a także poprawność tekstu źródłowego i kodowania znaków. SAPI jest tylko kanałem komunikacji, nie "poprawiaczem" treści.

Jak odpowiadać na pytania egzaminacyjne o SAPI i screen readery?

Najpierw ustal, czy pytanie dotyczy komunikacji między programami, czy jakości językowej mowy. SAPI kojarz z interfejsem/standardem API. Unikaj odpowiedzi opisujących "poprawne czytanie" znaków lub liczb, bo to zwykle rola TTS i ustawień.

info

Statystycznie 44% uczniów zna prawidłową odpowiedź. trudne

W praktyce zawodowej kluczowe jest to, że sAPI (Speech API) to warstwa pośrednia/standard komunikacji, dzięki której aplikacja (np. program udźwiękawiający) może korzystać z funkcji syntezatora mowy.

Źródła:

Microsoft Learn – Speech API (SAPI) overview / documentation (Speech), https://learn.microsoft.com/ (strony dokumentacji Speech API/SAPI) - dostęp 2026-03-01
Microsoft – Windows Speech API (SAPI) / Speech SDK legacy information (opis interfejsu mowy w Windows), https://learn.microsoft.com/ - dostęp 2026-03-01
Wikipedia (EN) – Microsoft Speech API, https://en.wikipedia.org/wiki/Microsoft_Speech_API - dostęp 2026-03-01

Materiały:

Dokumentacja producenta systemu operacyjnego dotycząca Speech API (SAPI)
Materiały szkoleniowe o screen readerach (np. wprowadzenie do udźwiękawiania i TTS)
Instrukcje i podręczniki konfiguracji syntezatorów mowy dla Windows

Aktualizacja pytania: 31.03.2026

LOGOWANIE

KWALIFIKACJA INF10 - STYCZEŃ 2015

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Zobacz też: