SAPI (Speech API) należy rozumieć jako interfejs (API) umożliwiający komunikację pomiędzy oprogramowaniem, które chce "mówić", a komponentem realizującym mowę, czyli syntezatorem mowy (TTS). W praktyce program udźwiękawiający lub inna aplikacja wysyła tekst oraz parametry (np. tempo, głośność, wybór głosu) do silnika mowy poprzez uzgodniony mechanizm. Dzięki temu możliwa jest wymiana syntezatora bez zmiany logiki działania aplikacji, o ile oba elementy obsługują ten sam standard.
Odpowiedź "komunikację pomiędzy programem udźwiękawiającym a programowym syntezatorem mowy" jest poprawna, bo opisuje istotę SAPI: pośredniczenie w połączeniu aplikacji z silnikiem TTS i ujednolicanie sposobu wywoływania funkcji mowy.
Pozostałe propozycje są błędne z typowych powodów:
- "poprawne odczytywanie liczb w systemie dziesiętnym" – to nie jest rola standardu komunikacji. To, jak liczby są interpretowane i wypowiadane, zależy od reguł językowych, ustawień, a często od samego syntezatora i aplikacji, nie od istnienia API.
- "poprawne odczytywanie znaków narodowych" – również nie jest gwarantowane przez sam interfejs. Kluczowe są kodowanie tekstu, obsługa języka oraz jakość i ustawienia silnika TTS. Interfejs jedynie przenosi dane i polecenia.
- "komunikację … z każdym syntezatorem mowy" – sformułowanie "każdym" jest zbyt szerokie. Standardy zapewniają współpracę w zakresie zgodności (np. syntezator zgodny z danym API), a nie z dowolnym, nieobsługującym danego interfejsu rozwiązaniem.
W kontekście pracy technika tyfloinformatyka warto zapamiętać praktyczną zasadę: gdy aplikacja "widzi" tylko część głosów lub nie wykrywa syntezatora, częstą przyczyną jest brak zgodności lub brak właściwego interfejsu/sterownika, a nie "błąd w czytaniu liter".