Referanssız Kalite Metriği – Multimedya Bölümü – Multimedya Bölümü Ödevleri – Multimedya Bölümü Tez Yaptırma –Multimedya Bölümü Ödev Ücretleri
Referanssız Kalite Metriği
Referanssız kalite metriği, videoda bulunan ortak kodlama ve aktarım yapaylıklarının analizine dayalı olarak görsel kaliteyi tahmin eder. Bu eserler, tıkanıklık, bulanıklık ve sarsıntı içerir. Bu metriğin bir blok diyagramı gösterilmektedir.
Referans dizisi hakkında herhangi bir bilgiye ihtiyaç duymaz. Referanssız bir metriğin kullanılması burada özellikle ilgi çekicidir çünkü semantik bölümleme de bir referans video gerektirmez.
Blokluluk metriği, bir çerçevedeki tipik blok modellerini arar. Bu blok desenleri, JPEG veya MPEG gibi DCT blok tabanlı görüntü ve video sıkıştırma yöntemlerinde ortak olan bir yapıdır.
Bloklar genellikle bir görüntüde, uzamsal fark sinyallerinin spektrumunda karakteristik tepe noktaları olarak görünen düzenli yatay veya dikey yapılar oluşturur. Bloklar düzenli değilse, her blok dokusuna ve sınırlarına göre ayrı ayrı tanımlanmalıdır. Spektral güç zirveleri ve sınır kontrastları, genel blokluluğun bir ölçüsünü hesaplamak için kullanılır.
Bulanıklık, görüntüdeki ince ayrıntı kaybının algısal bir ölçüsüdür. Kayıt veya kodlama işleminin bir aşamasında yüksek frekansların zayıflamasından kaynaklanır. Bulanıklık metriği, genellikle nesne konturlarını temsil eden kenarların genellikle keskin olduğu varsayımına dayanır.
Sıkıştırmanın bu kenarlarda bulaşma etkisi vardır. Böylece bulanıklık metriği, bir görüntüdeki önemli kenarları arar ve bunların genişliğini ölçer. Bu yerel kenar lekesinin daha sonra genel bir bulanıklık tahmini için tüm görüntü üzerinde ortalaması alınır.
Sarsıntılılık metriği, videodaki hareket sunumunu ölçmeye adanmış geçici bir metriktir. Sarsıntılılık, pürüzsüz görünmeyen donmuş resimlerin veya hareketin algısal bir ölçüsüdür.
Sarsıntının başlıca nedenleri ağ tıkanıklığı ve/veya paket kaybıdır. Ayrıca, verilen bit hızı kısıtlamalarına ulaşmak için kodlayıcının kareleri düşürmesi veya tekrar etmesiyle de tanıtılabilir. Sarsıntı metriği, video kare hızının yanı sıra videodaki hareket etkinliği miktarını da hesaba katar.
Bu metriklerin her ikisi de her videoda birkaç kare üzerinden küçük alt bölgelerde yerel kalite ölçümleri yapabilmektedir. Bu düşük düzeyli katkıları genel bir kalite derecelendirmesinde birleştirme süreci, gösterildiği gibi semantik bölümleme aşamasının sonucu tarafından yönlendirilir.
Burada açıklanan metrikler, algısal bir bozulma metriğinin tahmin performansını iyileştirmek amacıyla görsel verilere öncelik vermek için insan görsel sistemini taklit etmeye çalışır. Ortaya çıkan semantik video kalitesi metriği, bu nedenle, görüşün hem düşük seviyeli hem de yüksek seviyeli yönlerini içerir.
Düşük seviyeli yönler metriğin doğasında vardır ve renk algısı, kontrast duyarlılığı, maskeleme ve yapay görünürlüğü içerir. Üst düzey yönler, bir gözlemcinin semantik bölümleme yoluyla bir video izlerken bilişsel davranışını hesaba katar.
Değerlendirme
Yüz segmentasyonuna bağlı olarak tahmin performansının gelişimini değerlendirmek için, farklı veri kümeleri için normal tam çerçeve metriklerin derecelendirmelerini segmentasyon destekli metriklerin derecelendirmeleriyle karşılaştırıyoruz. Değerlendirmemizi, yüzlerin bir gözlemcinin dikkatini çektiği özel duruma odaklıyoruz. İçeriğin ilgili bölümlerindeki kalite değişikliklerinin algılanan video kalitesi üzerindeki etkisini ölçüyoruz.
Üç farklı öznel test veri tabanından test materyali ve öznel derecelendirmeler kullandık:
1. VQEG Faz I veri tabanı: Bu veri tabanı, 16 test koşuluyla ağırlıklı olarak TV materyalinden oluşur. Tam referanslı PDM’yi değerlendirmek için bu veri tabanından ilgili üç sahne seçildi.
2. PC video veri tabanı: Bu veri tabanı, toplam sekiz test koşulu için 1-2 Mb/sn bit hızlarında CIF boyutlu video ve çeşitli DirectShow kodekleri ile oluşturulmuştur. Tam referanslı PDM’yi değerlendirmek için bu veri tabanından iki sahne seçtik.
3. İnternet akış veri tabanı: Bu veri tabanı, MPEG-4, Real Media ve Windows Media ile 256 ve 512 kb/s’de kodlanmış kliplerin yanı sıra bazı paket kayıplarını (toplamda yedi koşul) içerir. Bu veri tabanından dört sahne kullanıldı. Buradaki test koşulları nedeniyle, bu diziler referansla düzgün bir şekilde hizalanamaz. Bu nedenle, referanssız metriğimizin değerlendirilmesi için bu seti kullanıyoruz.
Bu veritabanlarından seçtiğimiz sahneler, çeşitli ölçeklerde ve çeşitli miktarlarda baş ve kamera hareketlerine sahip yüzler içeriyor. Bazı örnekler gösterilmiştir.
Üç veri setimiz için değerlendirmenin sonuçları gösterilmektedir. Segmentasyon genellikle metriğin tahminleri ile sübjektif derecelendirmeler arasında daha iyi bir anlaşmaya yol açar. Eğilim, her üç veri seti için de aynıdır; bu, yüz segmentasyonunun, kalite metriklerinin tahminlerini artırmak için yararlı olduğunu gösterir.
Yazılım kalite Metrikleri
Kalite metrikleri
Metrik ne Demek
Ayrıca, yüzlere daha düşük ağırlık verilmesi tahmin performansının düşmesine neden olur. Bu gözlem aynı zamanda anlamsal bölümlemenin algılanan kaliteyi tahmin etmeye yardımcı olduğu sonucunu da desteklemektedir.
Beklendiği gibi, gelişme en çok yüzlerin çerçevenin önemli bir bölümünü kapladığı sahnelerde göze çarpıyor. Segmentasyon, yüzlerin oldukça küçük olduğu ve bazı test koşullarının neden olduğu arka plandaki bozulmaların izleyiciler için diğer bölgelere göre daha rahatsız edici olduğu sekanslar için en az faydalıdır.
Görsel dikkati etkileyen faktörleri ve bunların bir video kodlayıcıya ve segmentasyon kullanılarak algısal bozulma metriğine nasıl dahil edilebileceğini analiz ettik. Hareket eden nesne ve yüz bölümlemenin özel durumlarını inceledik ve çerçeve tabanlı bir kodlayıcının performans gelişimini ve bir bölümleme aşamasıyla birleştirilmiş video kalitesi ölçümlerini değerlendirdik.
Video kodlamada, segmentasyon desteğinin avantajları, hareketli nesneler içeren test dizileri ile düşük bit hızlarında gösterilmiştir. Kalite değerlendirmesinde, segmentasyon desteğinin avantajları, insan yüzlerini gösteren test sekansları ile gösterilmiştir ve bu, algısal bir kalite metriğinin tahminlerinin sübjektif derecelendirmelerle daha iyi uyum sağlamasıyla sonuçlanmıştır.
Segmentasyon desteği genel sisteme karmaşıklık katıyor olsa bile, yüzlerin ve hareketli nesnelerin algılanması için kullanılan algoritmalar standart kişisel bilgisayarlarda gerçek zamanlı olarak çalışıyor. Ayrıca, önerilen algısal video kodlama yöntemi bit akışına herhangi bir ek yük getirmez, dolayısıyla mevcut kod çözücülerle birlikte çalışabilirliğe izin verir.
Mevcut çalışma, artırılmış gerçeklik ve sürükleyici alanlar gibi uygulamalar için grafik, ses ve video dahil olmak üzere multimedya bilgilerinin değerlendirilmesine yönelik tekniğin ve sonuçların genişletilmesini içerir.