Co to jest zamiana tekstu na mowę / syntezator mowy (Text to Speech)?

To jest element działu: Jakie są dostępne systemowe usługi telefoniczne i/lub elementy oraz moduły wirtualnej centrali?

Zamiana tekstu na mowę / syntezator mowy (ang. Text to Speech), to rozwiązanie, które umożliwia w prosty sposób tworzenie zapowiedzi słownych w systemach opartych na wirtualnej centrali telefonicznej poprzez wykorzystanie mechanizmów opartych na syntezie mowy.

W dziale: "Jakie są dostępne systemowe usługi telefoniczne i/lub elementy oraz moduły wirtualnej centrali?" zobacz również:

 

Jest to bardzo wygodne rozwiązanie dla tych firm i organizacji, które często muszą zmieniać zapowiedzi słowne w swoich systemach telekomunikacyjnych, ze względu na specyfikę swojej pracy - na przykład obsługa zgłoszeń klientów, gdzie można od razu powiadomić osobę dzwoniącą, że dany problem jest znany, zgłoszony i odpowiednie służby już nad nim pracują. Jest również bardzo wygodny, ponieważ nie trzeba tutaj korzystać z usług lektorów, czy angażować jakichkolwiek osób do tworzenia nagrań i plików dźwiękowych. Osoba do tego uprawniona w panelu administracyjnym wpisuje odpowiedni tekst, wybiera głos który odczyta tekst, zatwierdza i zapowiedź jest gotowa i dostępna od razu po zatwierdzeniu.

 

Syntezatory mowy i zamiana tekstu na mowę, jest możliwa w różnych językach, ale zawsze należy zwrócić uwagę jakie głosy są udostępniane przez operatora świadczącego nam tą usługę. Ważne. Należy też zwrócić uwagę, że nie zawsze wszystkie słowa, skróty i składnie w zdaniach dobrze brzmią podczas odczytywania tekstu przez syntezator, dlatego po każdym zatwierdzeniu nowego komunikatu należy bezwzględnie odsłuchać całość zapowiedzi i ewentualnie wprowadzić poprawki. Na przykład zamiast wpisać "Witamy w Operatorzy.pl" trzeba wpisać niepoprawnie tekst: "Witamy w Operatorzy pe el", ponieważ syntezator mowy bez takiej modyfikacji mógłby nieprawidłowo odczytać końcową część zapowiedzi i mogłoby to brzmieć: "witamy w operatorzy kropka p l".

 

Synteza mowy działa wielosesyjnie, czyli w jednym czasie ta sama zapowiedź może być odtwarzana wielu dzwoniącym do nas osobom i to niezależnie od czasu połączenia, czyli jedni dzwoniący usłyszą początek zapowiedzi, a inni w tym samym czasie będą już w trakcie odsłuchiwania dowolnego innego jej fragmentu. Więc nie ma tu ograniczeń w zakresie ilości możliwych w jednym czasie odtworzeń tekstu.