Hareket Vektörleri – Multimedya Bölümü – Multimedya Bölümü Ödevleri – Multimedya Bölümü Tez Yaptırma –Multimedya Bölümü Ödev Ücretleri
Hareket Vektörleri
DVF’nin hareket vektörlerini kodlamak başlı başına zorlu bir iştir. Bir yandan, tarama yolu boyunca birçok ml,i hareket vektöründen oluşan uzun kod sözcükleri dikkate alınarak yüksek kodlama verimliliği elde edilebilir.
Öte yandan, açıklandığı gibi, optimal çözüm aramanın karmaşıklığı, parametrelerin diferansiyel kodlamasındaki bağımlılık sırası ile doğrudan ilişkilidir. İkisi arasında bir uzlaşma olarak, tarama yolu boyunca yapraklar arasında birinci dereceden bir bağımlılığa izin veren birinci dereceden bir DPCM şeması kullanılır.
Diğer bir zorluk, tipik bir görüntünün iki boyutta yoğunluk ve hareket vektörü korelasyonu sergilemesi, oysa bir tarama yolunun doğası gereği tek boyutlu olması gerçeğidir.
Hilbert eğrisine göre bir taramanın, belirli boşluk doldurma özelliklerine sahip olduğu ve 2B verilerin bir raster taramadan elde edilenden daha ilişkili olan bir temsilini oluşturduğu gösterilmiştir. Yinelemeli bir şekilde üretilebilir ve QT ayrıştırılmış görüntüler için doğaldır.
Geçerli çerçevedeki bir bl,i bloğunu, hareket vektörü ml,i kullanılarak, referans çerçevesindeki başka bir eşit büyüklükteki bloğa yaklaştırma işlemi, bl,i bloğunun kuantizasyonu olarak görülebilir; belirli bir distorsiyon ilişkilendirilirse, hız-kısıtlı hareket tahmini problemi, yaprak bağımlılıkları veya bağımlı kuantizörler ile bir QT’nin blokları arasında optimal bir bit tahsisi problemi olarak görülebilir. Bu nedenle, yöntemler (bir kafes içinde DP kullanan Lagrangian çarpanı tabanlı kısıtlanmamış optimizasyon) uygulanabilir.
Bir hareket vektörü altında en iyi blok eşleşmesinin aranması, optimizasyonun hesaplama açısından açık ara en pahalı kısmıdır. Aramayı daha hızlı yapmak için, olası hareket vektörlerinin yalnızca bir alt kümesinin dikkate alındığı, biraz yetersiz bir kümeleme şeması kullanılır.
Hareket Tahmini Sonuçları
QT tabanlı optimal hareket tahmin şeması, DVF’yi kodlamak için aynı kuantizörleri kullanan TMN4 (H.263 standardının bir uygulaması) ile olumlu şekilde karşılaştırır. QCIF video dizisi için en küçük blok boyutu olan 8×8 seçildi ve Hilbert taraması kare olmayan çerçeveleri kapsayacak şekilde değiştirildi. Tahmin edilen çerçevesi (180) ve buna karşılık gelen tarama yolu gösterilmektedir.
Orijinal çerçeve 180 ile karşılaştırıldığında, optimal QT hareket tahmini durumunda DFD tepe sinyal-gürültü oranı (PSNR) 31.31 dB’dir. Karşılık gelen bit hızı 472 bittir. Aynı hızda çalışan ve 30,65 dB’lik PSNR ile sonuçlanan TMN4 kodlayıcıyla karşılaştırıldığında, optimum şema, PSNR’de 0,67 dB’lik bir gelişmeyi temsil eder.
Hız yerine PSNR iki algoritma arasında eşleştirilirse (30,65 dB’de) sonuçlar daha dramatik olur (yani ikili problem çözülür). Bu durumda, optimal QT tabanlı hareket tahmincisi çerçeve 180’i 344 bit ile kodlar ve bu, TMN4’ün gerektirdiği 470 bite göre %26,8’lik bir gelişmedir.
Çerçeve enterpolasyonu sorunu, çok düşük bit hızlı video kodlamada çok önemlidir. Aktarım kanalı kapasitesi, bit hızına bir üst sınır getirerek, video sıkıştırmaya iki yönlü bir yaklaşım gerektirir: bazı çerçeveler kodlanır ve iletilir; diğer çerçeveler hiç kodlanmaz veya düşürülmez ve kod çözücüde enterpolasyon yapılmalıdır.
Video codec bileşenlerinin her üçüncü veya dördüncü kareyi düşürerek saniyede 7,5 veya 10 kare (fps) hızında çalışması yaygın bir durumdur. Çerçeve enterpolasyonu olmadan veya sıfır tutmalı çerçeve enterpolasyonuyla, yeniden oluşturulan video sekansı bir insan gözlemciye sarsıntılı görünecektir.
Bir çözümün iyiliğini yargılamak için bir ölçüm oluşturmak için yeterli bilgi verilmediği için enterpolasyon sorunu kötü bir şekilde ortaya konmuştur.
Konum vektörü çembersel hareket
Hız vektörü nasıl bulunur
Hız vektörü ile ivme vektörü aynı yönlü
Hız vektörü ile ivme vektörü zıt yönlü
İvme vektörü Nasıl bulunur
Ortalama hız vektörü
3 boyutta hareket
İvme vektörü yönü
Bizim bağlamımızda, enterpolasyonlu çerçevenin gelecekteki bazı çerçeveleri (fˆ) ve geçmişteki bazı çerçeveleri (fˆ), N0’da mevcut olan tek şeydir. Bu nedenle, orijinal atlanan çerçeve kod çözücüde bulunmadığından, MSE minimizasyonuna dayalı enterpolasyon mümkün değildir.
Bu sorunu çözülebilir kılan şey, video sahnesindeki değişikliklerin nesne hareketinden, özellikle doğrusal hareketten kaynaklandığı varsayımıdır.
Fˆ çerçevesi için hareketin fˆ çerçevesine göre tahmin edildiği ve ardından enterpolasyonlu çerçeveye yansıtılan N0’ın tahmin edildiği geleneksel yaklaşımın aksine, burada hareket doğrudan enterpolasyonlu çerçeve için tahmin edilir. Böylece enterpolasyonlu çerçevenin tüm sayfalarının bir hareket vektörü ile ilişkilendirilmemesi gerçeğiyle ilgili problemlerden kaçınılır.
Eldeki problem enterpolasyonlu çerçevenin bl,i bloklarına (QT ayrıştırması) ve ilişkili hareket vektörleri ml,i’ye bölünmesini bulmaktır. Ancak hareket, her iki referans çerçevesine (fˆ ve fˆ) göredir.
QT ayrıştırmasında bir blok b, 0 N l,i olarak enterpolasyona tabi tutulur; burada 0 ≤ n ≤ N, mj,x ve mj,y, bl,i ve N1 bloğunun mj hareket vektörünün x ve y koordinatlarıdır, N2, enterpolasyonlu çerçevenin sırasıyla f0 ve fN çerçevelerine olan zamansal mesafeleridir.
Bu ağırlıklı tanım, aralarındaki mesafe azaldıkça enterpolasyonlu çerçevenin daha yakın referans çerçevesine doğru yumuşak bir geçişine yol açarak daha az sarsıntıya neden olur.
xj’nin, mj hareketine maruz kalan enterpolasyonlu bl,i bloğuna karşılık gelen global sistem durumunu göstermesine izin verin. Tanımlanan blok interpolasyon formülü ile uyumlu olarak, ilişkili blok distorsiyonu aşağıdaki gibi tanımlanır.
Açıkça, tüm olası QT segmentasyonları ve DVF seçenekleri üzerinde tek başına tanımlanan çerçeve bozulmasını en aza indirmek, çerçevenin mümkün olan en küçük boyutlu bloklara bölünmesine yol açacaktır.
Ortaya çıkan DVF çok gürültülü olur ve bir video sahnesinde altta yatan nesne hareketine çok az benzer. Tahmini DVF’nin gerçek DVF’de bulunan bir pürüzsüzlük ölçüsüne sahip olması arzu edilir. Bu hedefe ulaşılabileceği ortaya çıktı.
Burada λ düzenlileştirme parametresidir. Yukarıdaki amaç fonksiyonunu en aza indirmek, düzgün bir DVF’ye yol açar, çünkü diferansiyel bir kodlama şemasında, DVF’nin düzgünlüğü ile kodlaması için gerekli bit hızı arasında güçlü bir korelasyon vardır.
Bu nedenle, bir tarama yolu boyunca hareket vektörleri için pürüzsüzlük elde edilir. Kullanılan Hilbert tarama yolu ile bu, tüm yönlerde DVF düzgünlüğüne dönüşür.
Daha sonra, açıklandığı gibi, bir kafes yapıya uygulanan DP’nin yardımıyla, düzenlileştirilmiş optimizasyon probleminin optimal çözümü bulunur.
3 boyutta hareket Hız vektörü ile ivme vektörü aynı yönlü Hız vektörü ile ivme vektörü zıt yönlü Hız vektörü nasıl bulunur İvme vektörü Nasıl bulunur İvme vektörü yönü Konum vektörü çembersel hareket Ortalama hız vektörü