
Türkçe transkripsiyon doğruluğunu ölçmek amacıyla Transkriptor tarafınca meydana getirilen detaylı benchmark çalışmasının detaylarına ve sonuçlarına göz atalım.
Türkçede transkripsiyon doğruluğunu ölçmenin kriterleri ve şekilleri, kültürel lehçeleri ve aksanları ne kadar iyi yakaladığını da ihtiva eder. İster İstanbul’un net söylenişi, ister Karadeniz bölgesinin süratli, kelime yutma ritmi olsun, her biri otomatik transkripsiyon sistemleri için benzersiz birer kontrol alanıdır.
Günümüzde podcast üreticileri, gazeteciler, hukukçular, akademisyenler ve toplumsal medya içerik üreticileri, kayıtlarını süratli ve doğru şekilde yazıya dökebilmek için otomatik sistemlere güveniyor. Sadece bu sistemlerin performansı daima aynı değil. Bir model, İstanbul Türkçesi’nde muhteşem netice verirken Karadeniz aksanında beklenmedik hatalar yapabiliyor.
Bu yazıda, Türkçe transkripsiyon doğruluğunu ölçmek amacıyla yaptığımız detaylı benchmark çalışmasının metodolojisini, bulgularını, örneklerini ve ergonomik ipuçlarını adım adım paylaşacağız.
Kontrol tasarımı ve ölçüm kriterleri dahil olmak suretiyle metodoloji nedir?
Kontrol tasarımı ve ölçüm kriterlerini içeren metodoloji, yalnızca “modeli çalıştır ve neticeleri al” yaklaşımından ibaret olması imkansız; aksine, güvenilirliği sağlamak için her adım dikkatlice planlanmalıdır. Bu adımlar içinde veri kümesi oluşturma, gürültü senaryoları ve model seçimi yer alır.
1. Veri seti oluşturma
Türkçe’deki aksan çeşitliliğini yansıtmak için dört ana grup belirlendi:
- İstanbul Türkçesi – Net artikülasyon, haber spikeri seçimi kayıtlar, resmi dil kullanımı.
- Karadeniz Aksanı – Süratli gidişat, hece yutma, kimi zaman meşhur harflerin daralması.
- Doğu Anadolu Aksanı – Ses uzatma, bazı meşhur değişimleri, melodik intonasyon.
- Arapça Etkili Aksan – Kelime sonlarında tonlama değişimleri, ekleme/çıkarma eğilimleri.
Her aksan için:
- 30 dakikası stüdyo kaydı,
- 30 dakikası organik ortam hitabı (pazar, sokak, kafe şeklinde) olmak suretiyle toplam 1 saatlik kayıt toplandı. Böylece 4 aksan için 4 saatlik ham ses verisi elde edildi.
2. Gürültü senaryoları
Gerçek yaşam koşullarını simüle etmek için her ses kaydına dört değişik senaryo uygulandı:
- Temiz kayıt – Stüdyo kalitesinde, minimum yankı.
- Hafifçe gürültü – Arka planda düşük seviyede ortam sesi (ör. bilgisayar fanı, hafifçe trafik).
- Yoğun gürültü – Pazar yeri, kalabalık kafe, vasıta kornaları şeklinde dikkat dağıtan sesler.
- Düşük kaliteli aygıt kaydı – Eski telefon mikrofonu yada düşük bit hızı.
Böylece, toplamda 4 aksan × 4 senaryo = 16 değişik kontrol ortamı oluşturuldu.
3. Model seçimi ve kontrol döngüsü
Üç değişik Türkçe destekli otomatik transkripsiyon modeli seçildi:
- Model A – Genel amaçlı, süratli işleme süresi.
- Model B – Gürültüye dayanıklı, suni zekâ destekli hata düzeltme.
- Model C – Aksan adaptasyonu için ek eğitilmiş sürüm.
Her ses dosyası üç modelde üçer kez çalıştırıldı. Averaj WER (Word Error Rate) ve CER (Character Error Rate) değerleri alındı.
4. Ölçüm metrikleri
- WER: Yanlış kelime / toplam kelime oranı.
- CER: Yanlış karakter / toplam karakter oranı.
- Not: WER yüksekse anlam bütünlüğü bozulur; CER yüksekse yazım hataları artar.
Türkçe’de Transkripsiyon Doğruluğu Sonuçlarına İlişkin Bulgular Nedir?
Temiz kayıtlar İstanbul Türkçesi’nde %95+ doğruluk verirken, yoğun gürültü ve bölgesel aksanlar bu oranı ciddi şekilde düşürdü. Karadeniz ve Arapça etkili aksanlar, bilhassa süratli konuşma ve ekleme/çıkarma eğilimleri sebebiyle hata oranını yükseltti.
Ethnologue’a nazaran Türkiye, 19 yaşayan yerli ve 25 yaşayan yabancı dile ev sahipliği yapmaktadır. Transkripsiyonun doğruluğu, tabloda gösterildiği şeklinde dil türüne nazaran değişmektedir:

İşte bazı örnek cümleler ve hata türleri:
İstanbul Türkçesi
- Orijinal: “Bugün hava hakkaten fazlaca güzel.”
- Hata: “Bugün hava gerçek ten fazlaca güzel.” (Boşluk hatası)
Karadeniz Aksanı
- Orijinal: “Bu yıl fındık azca oldu.”
- Hata: “Bu yıl fındı kaz oldu.” (Kelime birleştirme)
Doğu Anadolu Aksanı
- Orijinal: “Yarın misafirler gelecek.”
- Hata: “Yarın misafirler gel ecek.” (Yanlış boşluk)
Arapça Etkili Aksan
- Orijinal: “Ahmet yeni kitabı aldı.”
- Hata: “Ahmet yeni kit abi aldı.” (Meşhur kırılması)
Aksanları Geliştirmek İçin İpuçları Nedir?

Türkçede aksanları geliştirmenin yolları aksana bağlıdır. Mesela, İstanbul Türkçesinde telaffuzunuzu netleştirmeniz gerekirken, Karadeniz aksanında tempoyu düşürmeyi düşünebilirsiniz. İşte detaylar:
İstanbul Türkçesi
- Net söyleniş: Uzun kelimelerde heceleri belirgin söylemek.
- Kısa cümleler: Anlamı iki kısa cümleyle bölmek.
- Durağan(durgun) mikrofon mesafesi: Ses seviyesi dalgalanmaz.
Karadeniz Aksanı
- Gidişat düşürme: Modelin kelime sınırını anlaması için duraklamalar.
- Standart söyleniş denemesi: Mahalli söyleyişleri azaltmak.
- Gürültü filtreleme: Hafifçe gürültü bile hatayı artırır.
Doğu Anadolu Aksanı
- Ses uzatmalarını sınırlama: “Gelēcek” yerine “gelecek”.
- Meşhur uyumu: Beklenmedik meşhur değişimlerini azaltma.
- Ön kontrol: Modelin sese adaptasyonu.
Arapça Etkili Aksan
- Harf ekleme/çıkarma önleme: Standart telaffuza yakın konuşma.
- Tonlama düzenleme: Kelime sonlarını yumuşatma.
- Harici mikrofon: Telefon mikrofonlarındaki bozulmayı azaltma.
Netice: Genişletilmiş Değerlendirme
Türkçedeki aksan çeşitliliği, otomatik transkripsiyon teknolojileri için iki ucu keskin bir gerçeklik yaratır: bir taraftan mühim bir güçlük, öteki taraftan da büyük bir geliştirme fırsatı.
Netice olarak, doğru model, doğru kayıt tekniği ve aksana özgü bir strateji, bir çok senaryoda %90 yada daha yüksek bir doğruluk oranına ulaşır. Bu eşik, metnin anlamsal bütünlüğünü korumakla kalmaz, bununla birlikte içerik üretiminde vakit ve maliyet tasarrufu sağlayarak manuel düzenleme ihtiyacını en aza indirir.
Anadolu Ajansı’nın haberine nazaran, Türkiye’nin suni zekadaki oranı 600 milyon doları aştı ve fazlaca sayıda model hayata geçirildi. Türkçe transkripsiyonda başarıya giden yol, tek bir “muhteşem” model bulmaktan değil, veri, teknoloji ve insan faktörünün bilgili bir halde bütünleştirilmesinden geçer.

![Dünyanın İlk İnsansı Robot Olimpiyatları Pekin’de Başladı [Video]](https://hakanseyhan.com/wp-content/uploads/2025/12/1765560792_700x400-390x300.jpg)

