Skype'ta Birbirimizin Sesini Nasıl Duyuyoruz?
Bu yazı öğrendiklerim ve kanaatlerimin birleşiminden oluşmaktadır. Olası bir yanlış bilgilendirmeden ötürü sorumluluk bana aittir. - Hasan Fatih ŞİMŞEK

Bu yazıda Skype yazılımı baz alınarak sesin bir bilgisayardan bir başka bilgisayara nasıl iletildiğinden bahsedilecektir. Ayrıca bu işin teknik detaylarına da değinilecektir. Fakat telefon haberleşme sisteminden bahsedilmeyecektir. Sıkı durun, başlıyoruz.





Çoğumuz bilgisayar başında bir haberleşme yazılımı kullanmışızdır. Skype bunlardan sadece biri. Hiç düşünmüş müydünüz Türkiye'den farz-ı muhal taaa Amerika'daki yeğenle görüştüğümüzde sesimizi oradan nasıl duyduğunu ya da sesimizin kilometrelerce uzaktaki yere nasıl gittiğini? Bir an için düşünün: 100m ilerideki bir arkadaşa doğru konuşsak, hatta bağırsak sesimizi duyuramıyorken nasıl oluyor da kilometrelerce uzaktaki kimselere sesimizi duyurabiliyoruz? Bunu bilgisayar nasıl yapıyor dersiniz?





Her şey sesi kurcalamakla başladı desem sanırım yanlış olmaz. Ses varlığı incelendi ve incelendikçe bir çok keşif yapıldı. Bu keşifler sesin özellikleri ve davranışlarıydı. Nasıl bir taşın rengi, ağırlığı gibi kendine has özellikleri var ya da ışığın rengi, hızı gibi kendine has özellikleri var, ses varlığının da kendine has özellikleri vardır. İşte bu özellikler keşfedilerek biz insanlar tarafından kurcalanabilir olmuştur. Bu kurcalama yeteneği kazanıldıktan sonra günümüzde biz ses varlığını elektronik devrelerde işleyebiliyoruz, değiştirebiliyoruz, hatta üretebiliyoruz.





Varsayalım ki Karabük'teki bir çocuk Gaziantep'teki akrabaları ile görüşmek istiyor. Akrabaları çocuğu Skype'a yönlendiriyor. Yazılımın olanaklarını kullanarak karşı taraf ile bir arama başlatıyor. Şimdi bizi ilgilendiren kısma geldik. Karabük'teki çocuk "Selamun aleyküm!" diye bilgisayara doğru konuşur. Gelen ses havada yayıla yayıla bilgisayarın dahili mikrofonuna ya da bilgisayara bağlı harici bir mikrofona doğru gider. Sonra internet ağı aracılığıysa ses karşı taraftan "duyulur". Burada dikkatinizi bir noktaya çekmek istiyorum. Ses karşı taraftan duyulur dedim. Ses karşı tarafa iletilir demedim. Bu şu anlama geliyor. "Selamun aleyküm" diyen çocuğun sesi karşı tarafa aslında gitmiyor. Çocuğun sesi, çocuğun bilgisayarında ele alınıyor ve belli aralıklarda sesten örnekler seçiliyor. Her örneğe bir sayı veriliyor. Bu sayılar karşı tarafa gidiyor. Karşı tarafın bilgisayarı sesin karakteristik özelliğini ifade eden ya da diğer bir ifade ile sesin desibelini temsil eden bu sayıları yorumluyor. Yorumluyor derken her örneği temsil eden sayıları okuyor demek istiyorum. Her sayıyı yorumlayarak diyor ki donanımına: "Bana XXXX numaralı sesten üret". Tüm bu örnekleri temsil eden sayıları yorumlama işi saniyeler içerisinde gerçekleşiyor ve karşı tarafın bilgisayarı "yapay" bir ses üretiyor. Evet, yanlış duymadınız. Yapay bir ses üretiyor. Bu yapay ses tahmin edebileceğiniz gibi Karabük'teki ufaklığın sesinin hemen hemen tamamen aynısı. Şaşırtıcı değil mi?





Peki tüm bu örnekleme ve kodlama işlemi nasıl gerçekleşiyor da bu kadar gerçekçi ses elde edilebiliyor? Bunu açıklamadan önce analog ve dijital sinyal nedir onu bilmemiz lazım. Biraz sinyallerden bahsedelim. Analog ve dijital olmak üzere iki tip sinyal çeşidi vardır. Analog sinyaller zamanda sürekli olan sinyallere denir. Yani tıpkı bir biyoloğun mikroskoptan hücreye bakabilmek için merceğini büyültmesi gibi ve ne kadar çok büyütürse ucu bucağı olmayan bir şekilde yeni alemlere dalması gibi bir insan konuşmasını incelediğimizde ses sürekli bir değere(db) sahiptir. Ne kadar merceği sinyal üzerinde büyütürseniz büyütün sesin mevcut olduğu aralıkta ses sinyali hep bir değeri gösterir. İşte bu yüzden denir ki ses bir analog sinyaldir, yani zamanda süreklidir. Dijital sinyaller ise zamanda süreksiz ya da diğer tabirle ayrık olan sinyallere denir. Bu sinyaller, "zamankop"umuzun merceğini büyüttükçe bir değerin olmadığı alanlara rasgeldiğimiz sinyallerdir. Tahmin edebileceğiniz gibi bu sinyaller elektronik ortamlarda yer alır. Yukarıdaki resimde zamanda sürekli(analog) ve ayrık(dijital) sinyallerin temsili grafik gösterimini görmektesiniz.





Örnekleme ve kodlama işlemi şu şekilde gerçekleşmektedir: Bilgisayar, gelen analog sinyali(sesi) CODEC yardımıyla kodlar. Yani, sesin mesela 5 desibellik kısmına 0001 der, 7 desibellik kısmına 0010 der, vs... Bu şekilde sesin genliği boyunca tüm değerlerine bir ikili sayı atar. Buna kodlama denir. Kullanılan bu methoda ise Pulse Code Modulation denmektedir. "Sampling Theorem" uyarınca sinyalin frekansının iki katı kadar sinyalden örnekler seçilir. Yani belli aralıklarla denir ki şu noktanın genliğinin kodunu(sayısını) kaydetmek istiyorum. Yukarıdaki resme bakacak olursanız sinyalden örneklem seçilmesi için yatay eksene çekilen dikey çizgiler belirli aralıklara sahiptir. Bu aralıklar doğrultusunda seçilen her örneklemenin y eksenindeki karşılığı olan ikili sayı bilgisayar tarafından yanyana kaydedilir. Bu yanyana kaydedilen veriler bütününe dijital ses denir. Dijital ses dendiğine bakmayın. Bu ses falan değil. Sadece analog sinyali(sesi) temsil eden 0 ve 1'lerdir. Fakat sonuçta dijital ortamdan ses üretilmesine vesile olduklarından dolayı dijital ses olarak adlandırılmış olmalılar.





Dikkat ederseniz tane tane örneklem seçerek analog sinyali ayrık(çubuk çubuk) yapmış olduk. Bu ayrık sinyal - dijital ses - karşı tarafa internet ağı ile 1 ve 0 olarak, yani mesela elektriğin bir gönderilip bir gönderilmemesi ile saniyeler içerisinde iletilir. Karşı tarafın bilgisayarı bu dijital sesi(veriyi) okur ve ilgili desibel büyüklükleri ile eşleştirir. Buna mapping denmektedir. Bu eşleştirme sonucunda da karşı tarafın bilgisayarındaki hoparlörden Karabük'teki ufaklığın sesinin birebir aynısı çıkar. Birebir çıkmasını Sampling Theory şöyle açıklıyor: "Bir sesin frekasının iki katı kadar örneklem seçilirse sesin tüm karakteristik noktalarını almış gibi oluruz." Gerçekten de öyle değil mi? Tıpatıp aynı ses üretiliyor. Bazen seste bozulmalar olur. Karşılaşmıssınızdır. Zaman zaman robotik bir sese benzer bu duyduğumuz. Sanki sesin rengi kaçar. İşte bu bozulma analog sesi temsil eden dijital sesin, daha doğrusu dijital verinin iletimi sırasında gerçekleşen bit bozulması sonucu hatalı gelen bitlerin yorumlanması ile olur. Böylelikle hatalı ses üretilir.

Sabırla buraya kadar okuduğunuz için teşekkürler. Umarım aydınlatıcı olmuştur. :)

Yararlanılan Kaynak:

Bu yazı 04.12.2014 tarihinde, saat 05:53:02'de yazılmıştır. 22.08.2024 tarihi ve 19:46:33 saatinde ise güncellenmiştir.
Yazar : Hasan Fatih ŞİMŞEK Görüntülenme Sayısı : 3418
Yorumlar
Rıza Berkay AYÇELEBİ
Bende bu konuyu araştırıyordum önceden birde şu var siz konuşuyorsunuz karşı taraftaki insanın duyduğu ses birebir sizin sesiniz değildir.Çok çok çok benzer ama aynısı değil :)
Bu yorum 07.12.2014 tarihinde, saat 09:09:09'de gönderilmiştir.
Hasan Fatih ŞİMŞEK
Doğrudur. Zaten sürekli bir sinyali ayrık yapmakla sesi kayba uğratıyoruz. Dolayısıyla bu da senin dediğini tasdikliyor. Ancak yine de çok gerçekçi ve etkileyici bence. Nefes alışımızı bile yapay ses gayet güzel kotarıyor. :)
Bu yorum 07.12.2014 tarihinde, saat 11:32:47'de gönderilmiştir.
Yorum Ekle
*
* (E-posta adresiniz yayınlanmayacaktır.)
*
*

#Arşiv


#Giriş

ID :
Şifre :