Ses Sinyallerinin Ayrılması – Multimedya Bölümü – Multimedya Bölümü Ödevleri – Multimedya Bölümü Tez Yaptırma –Multimedya Bölümü Ödev Ücretleri

Olasılık
Algoritmanın en büyük avantajı yinelemesiz doğasıdır; ancak, olasılığın en aza indirilmesi doğrudan garanti edilmez. Yine de olasılık, modellemenin doğasını anlamak için uygun bir araçtır. Bir τ (T = 1) konuşlandırmak, kaynak başına bir parametre kullanarak (7.8)’deki p(S|ψ) kaynak dağılımını parametreleştirmeyle tutarlıdır. Daha fazla τ konuşlandırıldıkça, olasılığın daha esnek bir parametreleştirmesi uygulanır.
Olasılık, Fourier teknikleri kullanılarak basit bir şekilde hesaplanabilir. Bu aynı zamanda doğrulama/genelleştirme hatasının hesaplanmasını ve sonuç olarak minimum genelleme hatası elde etmeyi amaçlayan optimal t’leri seçmenin ilkeli bir yolunu sağlar. Ancak, bu tartışma bu bölümün kapsamı dışındadır.
Ses Sinyallerinin Ayrılması
Bu örnekte amaç, ICA’nın ses sinyallerinin ayrılmasına nasıl uygulandığını göstermektir. Bu, gösterilen kokteyl partisi problemi ile bağlantılı olarak kör sinyal ayrımının özel bir durumu olarak düşünülebilir.
Mevcut örnek, istatistiksel olarak bağımsız olduğu varsayılan üç kişinin konuşmasıyla ilgilidir. Sinyallerin örnekleme frekansı 11.025 Hz’dir ve her biri 50.000 örnekten oluşur. Bilinen sabit bir 3×3 karıştırma matrisi ile doğrusal bir anlık karıştırma devreye alınır ve ICA ayrımının nicel bir değerlendirmesini sağlar.
Kaynak ve karıştırma sinyalleri gösterilir. Genel olarak bu varsayımlar, yankı, gürültü, gecikme ve çeşitli doğrusal olmayan etkiler nedeniyle gerçek dünya uygulamalarında geçerli olmayacaktır. Bu gibi durumlarda, açıklandığı gibi, daha ayrıntılı kaynak ayrımı gerekir. Ayırma işleminin sonuçlarını değerlendirmek için, tanımlanmış sözde sistem matrisini dikkate alıyoruz.
A’nın tahmin edilen karıştırma matrisi olduğu yerde, P bir permütasyon matrisidir ve Cs(0) tahmin edilen kaynak sinyallerinin çapraz korelasyon matrisidir. Ayırma başarılı olursa, sistem matrisi birim matrise eşittir.
PCA Kullanarak Ses Ayırma
Açıklanan PCA, basit ve nispeten hızlı olduğu için sıklıkla kullanılır. Ayrıca kaynakları güce (varyansa) göre sıralayarak kaynak sayısını azaltma imkanı sunar. PCA ayrımının sonucu ve karşılık gelen sistem matrisi gösterilir. Açıkçası, tahmini kaynaklar orijinal kaynaklarla karşılaştırıldığında sonuç zayıftır. Bu, sistem matrisinin incelenmesiyle de doğrulanır.
Molgedey–Schuster ICA Kullanarak Ses Ayırma
Molgedey-Schuster ICA algoritmasının ana avantajı, yinelemesiz olması ve dolayısıyla çok hızlı olmasıdır. Standart bir T = 1 ICA kullanıldı ve τ = 1 seçimi en iyi performansı verdi.
Tahmini ses sinyallerinde ayırma gösterilmektedir. Orijinal kaynak sinyalleriyle karşılaştırma, çok iyi bir ayrım olduğunu gösterir. Sistem matrisi ve ek bir dinleme testi de bu sonucu doğrulamaktadır.
Çok yaygın olarak kullanılan Bell-Sejnowski ICA [6], sıfır gürültü durumunda sunulanlar gibi varsayımlarla maksimum olasılığa eşdeğerdir. Bell–Sejnowski ICA, olasılığın doğal gradyanı ile orantılı olarak güncelleyerek karışım matrisinin bir tahminini yinelemeli olarak hesaplar.
Adım boyutu (gradyan parametresi) başlangıçta 10−4 idi ve ikiye bölme kullanılarak bir çizgi araması kullanıldı. Algoritma, negatif log-olasılık 10−12’nin altında olduğunda sonlandırıldı. Yinelemeli doğası nedeniyle, bu algoritma Molgedey-Schuster algoritmasından çok daha fazla zaman alır.
Ayrılığın sonuçları gösterilir. Açıkçası, sistem matrisi, artan hesaplama yükü pahasına birim matrise olduğundan daha yakındır.
Sistem matrisinin birim matristen sapma normunu ve hesaplama süresini listeler. Açıkçası, PCA, çok sınırlı ayırma yetenekleri nedeniyle her iki ICA algoritması tarafından daha iyi performans gösterdi. Her iki ICA algoritması da çok iyi performans gösterdi.
En büyük fark, hesaplama süresidir; MS-ICA, BS-ICA’dan 200 kat daha hızlıydı. BS-ICA algoritmasının avantajı, yeterli hesaplama süresi sağlandığında sistem matrisinin birliğe önemli ölçüde daha yakın olabilmesidir.
BS-ICA’yı başlatmak için MS-ICA’nın kullanıldığı bir MS-ICA ve BS-ICA melezi bariz görünmektedir. Ayrılmış sinyalleri dinleyerek, ICA sonuçları arasındaki farkı söylemek neredeyse imkansızdı.
Ses dalga boyu
1 oktav ses
Oktav ses aralığı
Kedi Kovucu ses frekansı
4 oktav ses
Hayvanların ses duyma frekansları
Kibariye sesi kaç oktav
Köpekler hangi sesleri duyar
Görüntü Karışımlarının Ayrılması
ICA’nın görüntülere uygulanması, yüz tanımadan beyindeki aktif bölgelerin lokalizasyonuna kadar bir dizi uygulamada gerçekleştirilmiştir.
Bu bölümde, görüntü bölümleme için PCA’nın aksine veya PCA ile kombinasyon halinde ICA kullanan bazı temel özellikleri gösteriyoruz. Amaç, bir dizi görüntüden, ortak özelliklerin farklı görüntülere ayrıldığı sıralı görüntüleri çıkarmaktır.
Mevcut durumda ICA, ham görüntülere dayanmaktadır; ancak, ilke olarak, bölütleme, görüntülerden çıkarılan özelliklerden de yapılabilir. Bu örnekte gösterilen basit veri kümesi kullanılmıştır.
Her satırın bir görüntüyü temsil etmesi için P × N kaynak matrisi S’de yeniden düzenlenen N = 9100 (91’e 100) piksellik P = 4 orijinal kaynak görüntü vardır. M = 6 ile M × N sinyal matrisi X, aşağıdaki M × P karıştırma matrisi kullanılarak üretilir.
PCA Kullanarak Görüntü Bölümleme
Yüz veri kümesine PCA uygulamasının sonucu gösterilir. Sıfır olmayan özdeğerlerin sayısı doğru olarak 4 olarak belirlenmiştir. Kaş ve ağız konumlarının çiftler halinde çalıştığına dikkat edin; ağız “gülümsediğinde” “üzgün” olamaz ve aynı şey kaşlar için de geçerlidir.
PCA bu davranışı algılayabilir ancak 2. ve 3. kaynaklarda hem kaşları hem de ağız parçalarını karıştırır. Ayrıca, 1. kaynakta yalnızca burun bulunur. veriler için her zaman uygun olmayan varyanstır.
Molgedey–Schuster ICA kullanarak Görüntü Bölümleme
Görüntüler üzerinde ICA, X sinyal matrisine veya devrik X⊤’ye uygulanabilir. İlk durumda N = piksel sayısı ve M = kaynaklardaki piksellerin bağımsız olduğu varsayımına karşılık gelen dizideki görüntü sayısı.
Bu durumda kaynaklar görüntülerdir ve karıştırma matrisi zaman dizisidir. İkinci durumda, N = sıradaki görüntü sayısı ve M = bağımsız sürüş zaman dizisi kaynaklarına karşılık gelen piksel sayısı. Böylece, karıştırma matrisi (eigen)görüntülere karşılık gelir.
Piksel bağımsızlığı varsayıldığında (yani, sinyal matrisi olarak X kullanıldığında) sonuç gösterilir. Zamandan bağımsız olduğu varsayıldığında (yani, sinyal matrisi olarak X⊤ kullanıldığında) sonuç gösterilmektedir.
Gerçek görüntü uygulamaları genellikle PCA yerine ICA’yı tercih eder. Bunun başlıca nedeni, ICA’nın ortogonal olmayan bir temel üretebilmesi ve PCA’nın doğasında var olan varyans sıralaması tarafından kısıtlanmamasıdır.
Kaynak sayısını belirlemek için ICA’ya ön işleme olarak PCA’nın kullanılması başarılı olmuştur. Ayrıca, karıştırma matrisinin PCA tahmini, algoritma gibi yinelemeli bir ICA şeması için başlatma olarak kullanılabilir.
Molgedey-Schuster algoritmasını kullanarak ICA gerçekleştirmek, karşılaştırılabilir hesaplama maliyetinde PCA’dan daha iyi sonuçlar verir.
Piksel bağımsızlığına karşı zamandan bağımsız seçim, eldeki sorunla ilgilidir. Yukarıdaki görüntü bölütleme probleminde, piksel bağımsızlığı en iyi sonucu verdi; ancak, diğer durumlar zamandan bağımsız olmayı tercih etmiştir.
1 oktav ses 4 oktav ses Hayvanların ses duyma frekansları Kedi Kovucu ses frekansı Kibariye sesi kaç oktav Köpekler hangi sesleri duyar Oktav ses aralığı Ses dalga boyu