Speech
Recognition
Automatic Speech Recognition (ASR) adalah suatu pengembangan teknik dan system yang memungkinkan computer untuk menerima masukan berupa kata yang di ucap. Teknologi ini, memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dnegan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya mejadi sinyal digital dengan cara mengubah gelombang suara sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasika kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan yang dapat dibaca oleh perangkat teknologi sebagao sebuah komando untuk melakkan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilalukan secara otomatis dengan komando suara.
Alat pengeal ucapan, atau yang sering disebut dengan speech recognition ini, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam computer, dan kemudian digunakan sebagai basis data dalam memcocokkan kata yang diucapkan selajutnya. Sebagian besar alat pengenal ucapan ini sifatnya masih tergantung pada pengeras suara. Dan kekurangan lain dari alat ini, adalah alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja, serta hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sedikit dari peralatan ini yang sifatnya tidak tergatung pada pengeras suara dan dapat mengenal kata yang diucapkan banyak orang serta dapat mengenal kata-kata continue atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.
Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pengguna (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi berdasarkan kata yang diucapkan).
Alat ini sudah ada sejak tahun 1940, dimana pada tahun tersebuut perussahaan American Telephone and Telegraph Company (AT&T) sudah mulai mengembankan suatu perangkat teknologi yang dapat mengidentifikasi kata yang diucapkan manusia. Lalu, sekitar tahun 1960-an para peneniliti dari perusahaan tersebut sudah berhasil membuat suatu perangkat yang dapat mengidentifikasi kata-kata terpisah dan pada tahun 1970-an, mereka sudah dapat membuat perangkat yang dapat megidentikikasi kata-kata continue. Alat ini menjadi fungsional sejak tahun 1980-an dan hingga sekarang masih akan terus dikembangkan dan ditingkatkan keefektifannya.
Aplikasi-aplikasi alat pengenalan ucap dapat dilihat dari beberapa bidang, yaitu :
Bidang komunikasi
Dalam bidang komunikasi terdapat beberapa jenis alat pengenalan ucap, seperti :
1. Komando suara
Komando suara adalah suatu program pada computer yang melakukan perintahberdasarkan komando suara pengguna. Contohnya pada aplikasi Microsoft voice yang berbasis bahasa inggris. Ketika pengguna mengatakan “mulai kalkulator” dengan intonasi data tata bahasa yang sesuai. Maka, computer akan segera membuka aplikasi kalkulator.
Jika komando suara yang diberikan sesuai dengan daftar perintah yang tersedia. Aplikasi akan memastikan komando suara dengan menampilkan tulisan “apakah anda meminta saya untuk ‘memulai kalkulator’?”, untuk melakukan verifikasi. Pengguna cupuk mengatakan “lakukan” dan computer akan langsung beroperasi.
2. Pendiktean
Pendiktean adalah sebuah prosen mendikte yang sekarang ini banyak dimanfaaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft dictation yang merupakan aplikasi yang dapat menulikan apa yang diucapkan pengguna secara otomatis.
3. Telepon
Pada telepon, teknologi pengenalan ucapaan yang digunakan pada proses penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
Bidang kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya ada pada aplikasi Antarmuka Suara Pengguna aatau Voice User Interface (VUI) yang menggunakan teknologi pengenalan ucapan dimana pengendalian saklar lampu. Misalnya, tidak peril dilakukan secara manual dengan menggerakkkan saklar tetatpi cukup mengeluarkan parintah dalam bentuk ucapan sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat pada tangan. Penerapan VUI ini tidak hanya untuk lampu saja tetapi bisa juga untuk aplikasi-aplikasi control yang lain.
Bidang militer
Dalam bidang militer juga terdapat beberapa macam alat pengenalan ucap :
1. Pelatihan penerbangan adalah Aplikasi alat pengenal ucapan dalam bahasa militer adala pada pengaturan lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara berdialog.
2. Helicopter adalah Aplikasi alat pengenalan ucapan pada helicopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan system navigasi. Alat ini, sangat diperlukan pada helicopter karena ketika sedang terbang, sangat banyak gangguan yang akan menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan memencet tombol terlebih dahulu.
Kelebihan alat pengenal ucapan
Kelebihan dari peralatan yang menggunakan teknologi ini adalah :
1. Cepat
Teknologi ini mempercepat transmisi informasi dan umoan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu sampai dua detik setelah kita mengkomandokan peritah melallui suara komputeer sudah member umpan balik atas komando kita.
1. Mudah digunakan
Kemudahan teknologi ini juga dapat dilihat dalam aplikasi komando suara. Komando biasanya kita memasukkan ke dalam computer dengan menggunakan tatikus atau papan ketik, kini dapat dengan mudah kita lakukan tanpa perangkat keras, yaitu dengan menggunakan komando suara.
Kekurangan alat pengenal ucapan
Kekurangan dari peralatan yang menggunakan teknologi ini adalah :
1. Rawan terhadap gangguan
Hal ini disebabkan oleh proses sinyal suara yang masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara mempunyai komponen frekuensi yang sama banyaknya dengan komponen frekuensi gangguannya, akan sulit untuk memisahkan gangguan dari sinyal suara tersebut.
2. Jumlah kata yang dapat dikenal terbatas
Hal ini disebabkan pengenalan ucapan berkerja dengan cara mencari kemiripan dengan basis data yang dimiliki.
Tidak ada komentar:
Posting Komentar