Hareket Eden Nesneler – Multimedya Bölümü – Multimedya Bölümü Ödevleri – Multimedya Bölümü Tez Yaptırma –Multimedya Bölümü Ödev Ücretleri
Görme Modelleri
Çoğu görme modeli ve kalite metriği, görmenin alt düzey yönleriyle sınırlıyken, insanların video izlerken bilişsel davranışları göz ardı edilemez. Bilişsel davranış, bireyler ve durumlar arasında büyük farklılıklar gösterebilir, bu da genelleme yapmayı çok zorlaştırır.
Ayrıca, yukarıda listelenen faktörlere insan görsel sistemi tarafından verilen göreceli önem hakkında çok az şey bilinmektedir. Bununla birlikte, yukarıdaki çalışmalara ve görsel dikkati artıran faktörlere dayanarak, çeşitli hesaplamalı dikkat modelleri geliştirilmiştir.
Kenar gücü, doku enerjisi, kontrast, renk değişimi ve homojenlik gibi algısal faktörleri hesaba katarak, dikkat odağı için bir tahmin olarak bir dizi için bir önem haritası oluşturmayı önerdi.
Renk, kontrast, boyut, şekil, konum ve ön planı dikkate alarak hareket tahmini ve cilt algılama ile segmentasyona dayalı bir model geliştirdi. Sabit ve video sahnelerinden oluşan geniş bir veri tabanı kullanılarak yapılan bir deneyden toplanan göz hareketi verileriyle kalibre edilmiş ve test edilmiştir.
Son zamanlarda, bir sahnedeki ilgili nesneleri bulmak için göreve özgü anahtar sözcükleri kullanan ve görevle ilgili görsel bir harita oluşturmak için alt düzey özelliklerini çıkaran bir model gösterdi. Bu bölümde, yüzler ve hareketli nesneler olmak üzere iki önemli üst düzey unsura odaklanıyoruz.
Yüzlerin ve Hareket Eden Nesnelerin Çekiciliği
İnsanlar ve özellikle yüzler en çok dikkat çeken nesnelerin başında gelir. Bir sahnede insanların yüzleri varsa hemen onlara bakarız.
Ayrıca, insanların yüzlerine aşinalığımız nedeniyle yüzlerde meydana gelen bozulmalara veya kusurlara karşı çok hassasızdır. Yüzlerin öneminin altı, tüketici fotoğrafçılığındaki imaj çekiciliği üzerine yapılan bir çalışmayla vurgulanmıştır. Resim seçiminde en önemli kriterler arasında resimdeki kişiler ve yüz ifadeleri yer alır.
Benzer bir şekilde, izleyiciler bir sahnedeki belirli hareket eden nesneleri de izleyebilir. Aslında, hareket (özellikle çevrede) izleyicilerin dikkatini çekme eğilimindedir. İnsan görme sisteminin uzamsal keskinliği görüntünün retinadaki hızına bağlıdır: Retinal görüntü hızı arttıkça uzamsal keskinlik azalır.
Görsel sistem, retinal görüntü hızını en aza indiren ve ilgilenilen nesneyi fovea üzerinde tutan yumuşak takipli göz hareketleriyle hareket eden nesneleri izleyerek bu sorunu çözer. Düzgün takip, yüksek hızlarda bile iyi çalışır, ancak büyük hızlanmalar ve öngörülemeyen hareket tarafından engellenir.
Öte yandan, belirli bir hareketi izlemek, farklı yönlerde veya farklı hızlarda hareket eden arka plan ve nesneler için uzamsal keskinliği azaltacaktır. Bu duyarlılık değişikliklerinden bazılarını hesaba katmak için özetlendiği gibi uzay-zamansal kontrast duyarlılık fonksiyonunun (CSF) uygun bir şekilde ayarlanması, bu tür fenomenlerin modellenmesinde ilk adım olarak kabul edilebilir.
Bu gözlemlere dayanarak, önerilen video kodlayıcı ve algısal kalite metriği, görüşün hem düşük hem de yüksek seviyeli yönlerini hesaba katar.
Bunu başarmak için, video kodlayıcıya ve ilgi alanlarını bulmak için kalite metriğine bir segmentasyon aşaması eklenir. Segmentasyon çıktısı daha sonra anlamsal olarak daha yüksek öneme sahip bölgelere daha fazla ağırlık vererek kodlamada bir ön işleme adımına ve video kalitesi değerlendirmesinde bir havuzlama sürecine rehberlik eder.
Araç Multimedya
Araç multimedya tavsiye
Multimedya Ekran
Navimex multimedya
Araç Multimedya Android
Araç Multimedya Sistemleri
Multimedya Teyp
Android Multimedya
Anlamsal Bölümleme
İnsanların bir video izlerken bilişsel davranışlarına üst düzey katkı, semantik bölümleme yoluyla dikkate alınır. Belirli bir bilişsel görevin semantik modelini temsil etmek için, dizinin her bir çerçevesini birbirini dışlayan ve ortaklaşa ayrıntılı bölüm kümelerine ayrıştırırız.
Genel olarak, bu anlamsal bölümün topolojisi homojenlik kriterleri kullanılarak ifade edilemez, çünkü böyle bir bölümün öğeleri mutlaka değişmez özelliklere sahip değildir.
Sonuç olarak, bölütlemek istediğimiz nesneler hakkında biraz bilgi sahibi olmamız gerekir. Bu tür apriori bilginin iki durumunu ele alacağız, yani yüzlerin bölütlenmesi ve hareket eden nesnelerin bölütlenmesi. Son bölüm, her görüntünün ön plan alanlarından ve arka plan alanlarından oluşacaktır.
Renk segmentasyonu ve özellik sınıflandırması, insanların yüzlerini segmentlere ayırmak için kullanılabilir. Yüz segmentasyonu için nispeten güçlü bir dizi algoritma, sahnenin genel aydınlatması önemli ölçüde değişmediğinde, insan ten renklerinin krominans (Cb, Cr) düzleminde dar bir bölgeyle sınırlı olduğu gerçeğine dayanmaktadır.
Aksi takdirde, renk uzayındaki ten rengi yamalarının ötelenmesi, ölçeklenmesi ve döndürülmesine dayalı olarak her karede ten rengi dağılımının gelişimini izlemeye dayalı yöntemler kullanılabilir. Renk bölümlemesine dayalı yaklaşımların sınırlarından biri, ortaya çıkan bölümün vücut bölümlerinin yanı sıra yüzleri de içerebilmesidir.
Bu sorunun üstesinden gelmek için, renk bölütleme ile yüz özelliği çıkarımının bir kombinasyonu kullanılabilir. Diğer yaklaşımlar yalnızca özellik sınıflandırıcıları kullanır. Bir dizi basit sınıflandırıcıya ve bütünleşik görüntüye dayalı bir yüz dedektörü önerdi. Bu dedektör, aşağıdaki gibi çalışan çok aşamalı bir sınıflandırmadır.
İlk olarak, gri seviyeli integral görüntüden Haar tabanlı fonksiyonlara benzer öznitelikler çıkarılır. Ardından, az sayıda ilgili özelliği seçmek için AdaBoost adlı bir öğrenme adımı kullanılır. Bu budama işlemi, yalnızca bir özelliğe bağlı olan zayıf sınıflandırıcıları seçer.
Son olarak, ortaya çıkan sınıflandırıcılar kademeli bir yapıda birleştirilir. Böyle bir yaklaşımla, küçük görünen veya önden olmayan bir yüz güvenilir bir şekilde algılanamaz.
Ancak böyle bir durumda yüz, genel olarak bakanların dikkatini önden veya büyük bir yüz kadar çekmez. Bu nedenle, bu sınırlama önerilen yaklaşımı önemli ölçüde etkilemeyecektir. Susie test sekansı için bir yüz algılama örneği gösterir.
Hareket eden nesneleri bölümlere ayırmak için hareket bilgisi semantik olarak kullanılır. Bir nesnenin hareketi genellikle arka planın ve çevredeki diğer nesnelerin hareketinden farklıdır. Bu nedenle, birçok çıkarma yöntemi, nesneleri bölümlere ayırmak için video dizilerindeki hareket bilgisinden yararlanır.
Değişiklik algılama, harekete dayalı nesne bölümleme sorununu çözmek için kullanılan tipik bir araçtır. Hareketli kamera ve statik kamera koşulları için farklı değişiklik algılama teknikleri kullanılabilir. Kamera hareket ederse, değişiklik algılama tutarlı ve tutarsız hareketli alanları tanımayı amaçlar.
İlki arka plan alanlarına, ikincisi video nesnelerine karşılık gelir. Kamera statikse, değişiklik algılamanın amacı hareketli nesneleri (ön plan) ve statik arka planı tanımaktır. Burada tartışılan semantik bölümleme, statik kamera sorununu ele alır ve genel hareket dengelemesinden sonra hareket eden bir kamera durumunda uygulanabilir.
Android Multimedya Araç Multimedya Araç Multimedya Android Araç Multimedya Sistemleri Araç multimedya tavsiye Multimedya Ekran Multimedya Teyp Navimex multimedya