Speech
Syntesis
Speech synthesis atau pidato sintesis adalah produksi buatan manusia pidato. Sebuah ssistem computer yang digunakan untuk tujuan ini disebut speech synthezer, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. Text-to-speech (TTS) system bahsa normal mengkonversi teks ke dalam pidato. System lain membuat representasi linguistic simbolis seperti transkripsi fonetik bicara.
Pidato buatan dapat dibuat dengan potongan-potongan concatenating pidato yang direkam disimpan dalam databace. Sestem berbeda dalam ukuran pidato yang tersimpan unit, sebuah system yang menyimpan telepon memberikan rentang output terbesar, tetapi kirang jelas. Untuk keperluan khusus domain, yang menyimpan seluruh kata-kata atau kalimat memungkinkan output yang berkualitas tinggi. Atau, synthesizer dapat menggabungkan sebuah model dari system vocal dan karakteristik suara manusia lain untuk membuat yang benar-benar “sintetik” output suara. Kualitas synthesizer pidato dinilai oleh kesamaan dengan suara manusia dan kemapuannya untuk dipahami, semua dimengerti text-to-speech profram yang memungkinkan orang-orang dengan gangguan visual atau membaca untuk mendengarkan karya-karya tulis di computer rumah.
A text-to-speech system (atau “mesin”) adalah terdiri dari dua bagian: front-end dan back-end. Front-end memiliki dua tugas utama. Pertama, mengubah teks mentah berisi simbol seperti angka dan singkatan menjadi setara dengan tertulis-kata-kata. Proses ini sering disebut normalisasi teks, pra-pengolahan, atau tokenization. Front-end kemudian menetapkan transkripsi fonetik untuk setiap kata, dan membagi dan menandai teks ke prosodic unit seperti frase dan kalimat. Proses transkripsi fonetik untuk menetapkan kata-kata ini disebut teks-ke-fonem atau grafem-ke-fonem konversi. Fonetis transkripsi dan informasi ilmu persajakan bersama-sama membentuk representasi simbolik yang linguistik output dengan front-end. Back-end-sering disebut sebagai synthesizer-maka mengubah representasi linguistic simbolik menjadi suara. Synthesizer teknologi
Kualitas yang paling penting dari sebuah sistem sintesis pidato kewajaran dan dimengerti. Kewajaran menggambarkan seberapa dekat output terdengar seperti ucapan manusia, sementara dimengerti adalah kemudahan yang keluaran dipahami. Pidato synthesizer yang ideal adalah alami dan dipahami. Pidato sistem sintesis biasanya mencoba untuk memaksimalkan dua karakteristik
Contoh : Fasilitas Text to Speech pada sistem operasi Microsoft Windows
Tidak ada komentar:
Posting Komentar