Türkçe
Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerinde
kullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlarda
kelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ile
akustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir.
ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır.
Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukça
önemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarak
Türkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazım
hatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metin
verisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimeler
bulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerin
yer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarak
kabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimeler
morfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacak
olan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimeler
ile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme ve
doğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | December 30, 2019 |
Published in Issue | Year 2019 Volume: 2 Issue: 2 |
Dergimizin Tarandığı Dizinler (İndeksler)
Academic Resource Index | Google Scholar | ASOS Index |
Rooting Index | The JournalTOCs Index | General Impact Factor (GIF) Index |
Directory of Research Journals Indexing | I2OR Index
|