Piksel Hareket Tahmini – Multimedya Bölümü – Multimedya Bölümü Ödevleri – Multimedya Bölümü Tez Yaptırma –Multimedya Bölümü Ödev Ücretleri
DCT Tabanlı Alt Piksel Hareket Tahmini
Sürekli koordinatın (u,v) bir kamera düzleminde sürekli bir yoğunluk profili It (u, v) oluşturan hareketli bir nesneyi düşünün, burada t alt simgesi çerçeve numarasını gösterir. Bu yoğunluk profili daha sonra, m ve n’nin tam sayılar olduğu yerde gösterilen xt (m, n) piksellerinin geçerli çerçevesini oluşturmak için d örnekleme mesafesi ile kameranın sabit örnekleme ızgarasında sayısallaştırılır.
Ayrıca nesnenin t − 1 ve t çerçeveleri arasındaki yer değiştirmesinin (du,dv) olduğunu varsayalım, öyle ki It(u,v) = It−1(u − du,v − dv) burada du = (mu + νu )d = λud ve dv = (mv + νv)d = λvd. Burada mu ve mv yer değiştirmenin tamsayı bileşenleridir.
DCT Tabanlı Yarım Pel Hareket Tahmin Algoritması
Buradan, sözde fazlarda alt piksel hareket bilgisinin açık olmasa da gizli olduğunu biliyoruz. Alt piksel hareket tahminlerini elde etmek için, (9.79)’daki sözde fazları doğrudan hesaplayabilir ve ardından sözde fazlara alt piksel sinüzoidal ortogonal ilkeleri (9.70)–(9.73) uyguladıktan sonra sinc fonksiyonlarının tepe noktalarını bulabiliriz.
Alternatif olarak, önce bir tamsayı-pel hareket tahmini elde etmek için DXT-ME algoritmasını kullanarak ve ardından DXT’de hesaplanan sözde faz fonksiyonlarını f(k,l) ve g(k,l) kullanarak daha iyi esnekliğe ve ölçeklenebilirliğe sahip olabiliriz. -ME algoritması tahmin doğruluğunu yarı pel’e yükselttiği için, formun bire bir aynısına sahip olması nedeniyle ilgilidir.
Spesifik olarak, alt piksel sinüzoidal ortogonal ilkelerine (9.70)–(9.73) dayalı olarak, alt piksel hareket bilgisi, tepe konumları yer değiştirmeyle yakından ilişkili olan impuls fonksiyonları biçiminde çıkarılabilir.
Tasarımda esneklik ve modülerlik ve karmaşıklığın daha da azaltılması adına, alt piksel sinüzoidal ortogonal ilkeleri DXT-ME’den geçirilen sözde faz fonksiyonlarına uygulayarak keyfi kesirli pel doğruluğuna sahip bir hareket tahmin şeması tasarlamak için ikinci yaklaşımı benimsiyoruz.
Tahmin doğruluğunun sınırlandırılması, yalnızca ξ fonksiyonlarının etkileşim etkileri ve ξ fonksiyonunun sıfır ve civarındaki eğimi ve örneklemeden sonraki sözde fazlarda alt piksel hareket bilgisinin ne kadar iyi korunduğu ile belirlenecektir.
Alt piksel hareket yönünü belirleme kuralları özetlenmiştir ve tamsayı-pel hareket yönünü belirleme kurallarına benzerdir. DCT alanındaki alt piksel yer değiştirmelerinin nasıl tahmin edileceğini göstermektedir.
SNR = 50 dB’de x1(m,n)’den (2,5,−2,5) kaydırılmış 16 × 16 (yani, N = 16) ve x2 (m, n) boyutunda giriş görüntülerini x1 (m, n) tasvir edin. Bu iki görüntü, u, v ∈ [−5, 5] için sürekli yoğunluk profili xc(u, v) = exp(−(u2 + v2))’den d = 0,625 örnekleme mesafesinde dikdörtgen bir ızgara üzerinde örneklenir.
Fourier dönüşümü, koşulu sağlamak için Şekil 9.16b’deki gibi bant sınırlıdır ve f, DSC(‘yi de hesaplayan DXT-ME algoritması tarafından sağlanan f(k, l) ve g(k, l) sözde fazlarının 3B çizimleridir. m, n) ve DCS(m, n) gösterildiği gibi ve tepe noktaları (3, 1) ve (2, 2)’de konumlandırılan tepe noktaları tamsayı-pel tahmini yer değiştirme vektörlerine (3, −2) ve (2, −3), çünkü yalnızca birinci kadran görüntüleniyor.
Aslında, DSC(m, n) ve DSC(m, n) {(m, n); m = 2, 3, n = 1, 2}. Yarım pel doğruluğunda bir tahmin elde etmek için, gösterildiği gibi u, v = 0 : 0,5 : N – 1 için sırasıyla (9.81) ve (9.82)’de DSC(u, v) ve DCS(u, v)’yi hesaplarız. ve j, nerede iki giriş görüntüsü birbirine benzemese bile, gerçek yer değiştirme vektörüne tam olarak eşit olan hareket tahminine (2.5, -2.5) karşılık gelen (2.5, 1.5)’te tepe noktaları açıkça tanımlanabilir.
Görüntü işleme uygulamaları
Görüntü işleme tez örnekleri
Görüntü işleme teknikleri
Gerçek Zamanlı Nesne tespiti
Görüntü işleme kod
Görüntü işlemeye nasıl başlanır
notasyona : r : aralığın kısaltması{a+i·r for i = 0,… ,⌊b−a⌋} = r {a,a + r,a + 2r,… ,b − r,b}. Karşılaştırma için, u,v = 0 : 0.25 : N − 1 = 0,0.25,0.5,… için sırasıyla ve l’de DSC(u,v) ve DCS(u,v) çizilmiştir. ,N − 1.25, N − 1, burada (9.83) ve (9.84)’ün DCS ve DSC’sine özgü ξ fonksiyonları nedeniyle düzgün dalgalanmalar açıktır ve (2.5, 1.5)’te de tepe noktaları vardır.
2. adımda, DXT-ME algoritmasının en yakın tamsayı-pel hareket tahminini (mˆu , mˆ) bulması nedeniyle yalnızca tamsayı-pel tahmini (mˆu , mˆv ) etrafındaki yarım-pel tahminleri dikkate alınır. v ) alt piksel yer değiştirmesinden. Bu, tüm olası yarım pel yer değiştirmeleri değerlendirmeden hesaplama sayısını önemli ölçüde azaltacaktır.
3. adımda, εD’nin kullanımı, yer değiştirme -0,5 olduğunda sıfır sözde fazlar durumuyla ilgilenir. Spesifik olarak, λu = −0,5 ise, o zaman gSC (k, l) = 0, ∀k, l, bu da g(k, l) = 0 ve DSC(u, v) = 0’a yol açar. Ancak, gürültülü bir durumda, g(k, l)’nin tam olarak sıfır olmaması ve dolayısıyla DSC(u, v)’nin de tam olarak sıfır olmaması çok olasıdır.
Bu nedenle, εD çok küçük ancak gürültülü durumu barındıracak kadar büyük ayarlanmalıdır. Deneyimizde, εD ampirik olarak 0.08 olarak seçilmiştir. λv = −0.5 için DCS(u, v) üzerinde de benzer bir değerlendirme yapılır. DCS(u, v) ve DSC(u, v)’nin tepe konumlarının gürültülü koşullarda farklı olması da mümkündür.
Bu durumda DXT-ME algoritmasında kullanılan tahkim kuralı uygulanabilir. Bu HDXT-ME algoritmasının doğruluğunu göstermek için, girdi olarak 16 × 16 noktalı bir görüntü x1 in a kullanırız ve gerçek hareket alanına {(λu,λv) : λu,λv göre ikinci giriş görüntüsü x2’yi oluşturmak için x1’i değiştiririz = −5 : 0.5 : 4}, m için dört komşu piksel değerinden x(m + u, n + v) değerini enterpole eden MPEG standardında belirtilen çift doğrusal enterpolasyon işlevi yoluyla, n tam sayılardır.
Gerçek hareket alanıyla tamamen aynı olan HDXT-ME algoritması tarafından tahmin edilen hareket alanını gösterir. Sırasıyla Ls(u,v), Lc(u,v) ve Lc(u,v) + Ls(u,v)’den elde edilen tepe bilgilerini kullanan yarım pel hareket tahmin şemaları için tahmin doğruluğunu daha fazla gösterin. Şekil 9.18a’da, “+” çizgisi, farklı gerçek yer değiştirme değerlerine göre {−7 : 0,5 : 7}.
“o” çizgisi, Tablo 9.6’daki kurallara göre Ls (u, v) tepe işaretlerinden hareket yönlerinin belirlenmesinden sonraki nihai tahminleri belirtir. Bu tahminlerin, u = v referans çizgisiyle hizalandığı gösterilmiştir, bu onların doğruluğunu ima eder. Gerçek yer değiştirme = −0.5 için, tüm v için Ls(−0.5,v) ≡ 0 ve tahminin −0.5 olarak ayarlanıp ayarlanmayacağına karar vermek için εD kullanılır.
Ls(u,v) yerine Lc(u,v) kullanılır, ancak Lc(u,v) her zaman pozitiftir, bu da hareket yönünü belirlemek için tepe işaretinin kullanılamayacağı anlamına gelir. Lc(u,v) + Ls(u,v), tüm gerçek yer değiştirme değerleri için ayarlama yapmadan doğru tahminler sağlar, ancak indeks aralığı negatif indeksler içermelidir.
HDXT-ME algoritmasında, adım 2, (mˆu,mˆv) ve civarında yalnızca dokuz DCS(u,v) ve DSC(u,v) değerini içerir. DCS(u, v) ve DSC(u, v), ters 2D-DCT-II’nin varyantları olduğundan, önerilen paralel ve tamamen boru hatlı 2D DCT kafes yapısı, DCS(u,v) ve DSC(u, v) N adımda O(N) işlem maliyetiyle. Ayrıca, adım 3’teki arama, bir adım için O (N2) işlemlerini gerektirir. Dolayısıyla, HDXT-ME algoritmasının hesaplama karmaşıklığı toplamda O(N2)’dir.
Gerçek Zamanlı Nesne tespiti Görüntü işleme kod Görüntü işleme teknikleri Görüntü işleme tez örnekleri Görüntü işleme uygulamaları Görüntü işlemeye nasıl başlanır