Facebook’un yapay zekaya ve akıllı kameraya haiz Portal aletinin iyi mi geliştirildiğini, cihazın geliştirici ekibi söyledi.
Facebook, görüntülü arama aracı Portal’ı geçtiğimiz kasım ayında yayınladıktan sonrasında, en sonunda aleti açtı ve Portal’ın iç emek verme mekanizmasını gösterdi. Facebook Donanım Başkan Yardımcısı Rafa Camargo ve Matt Uyttendaele, Portal’ın geliştirme süreci hakkında Engadget’a detaylı bilgiler verdi.
Facebook Yapay Zeka Araştırma Grubu (FAIR, Facebook’s AI Research), sistem üstüne çalışmaya başladığında ekip kendine “Organik ve cazip hissettirecek, otomatikleştirilmiş bir kamerayı iyi mi yapacağız” sorusunu sordu.
Bu etkiyi yaratmak için Portal’ın geliştirici ekibi cihazın, hareketleri öykünmek edecek akıllı kamerasını tasarladı. Camargo’nun söylediğine gore, geliştirmenin bu aşamasında ekip ödüllü film yönetmenleri, belgesel yapımcıları ve kameramanlar ile çalışmış. Onlardan aldıkları geri bildirimler, geliştirme aşamasını yönlendirmelerine destek olmuş. Camargo, bu aşama için “Aslen kameranın yok olduğu ana odaklanmıştık bu sebeple kameranın fark edilmediği anlamış olur daha organik” diyor.
Dile kolay olsa da burada söyleneni başarmak oldukça zor. Ekip olarak donanımda ne kullanılacağına karar verildi ve bunun için de komutları verecek olan yapay zekayı geliştirilmeye başlandı. Başlangıç da görsellerdeki objeleri tanımlayabilen bir vücut tanımlama sistemi olan Mask R-CNN ile yapılmış oldu. Uyttendaele’a gore Mask R-CNN, görsellerdeki nesneleri bulmada oldukça iyiydi ve bu iş için de oldukça uygundu.

Sadece 2017’deki Mask modeli, geliştirilmek istenen Portal için çok da fazla uygun değildi. O vakit mevcud Mask modeli bununla beraber ek süreçleri ve soğutma donanımlarını gerektiriyordu ve bu da Portal’ı daha pahalı sadece daha azca güvenilir hale getiriyordu. Bunun üstüne Facebook araştırma ekibi modeli geliştirdi ve geliştirdikleri modele Mask R-CNN2Go adını verdi. Mask 2 Go, önceline gore 400 kat daha hızlıydı. Ek olarak yeni modelin düşük ışık performansı da geliştirilmişti.
Uyttendale’e gore, “Orijinal Mask R-CNN araştırması, değişik durumlardaki insanları tanımlayabilme kapasitesini bir kenara bırakmıştı.” Sadece Portal’ın geliştirilmesindeki aslolan hedef kararlılık ve verimlilikti. Sisteme değişik durumlardaki insanoğlu üstünde eğitim yaptırılabilecek vakit yoktu.

Camargo “Tam vücut pozisyonunu idrak etmek için Portal’a hakkaten ihtiyacımız vardı. Mesela, koltukta üstünüzde battaniye varken yattığınızı düşününün. Sistem bunu fark etmeli. Bir tek yüzünüzü görüyor olmalı ve vücut pozisyonu dikeyden ziyade yatay olmalı bu sebeple sizi değişik şekilde ayarlayabilmeli. Size değişik şekilde yakınlaşabilmeli” diyor.
Akıllı kameranın yapay zekası, görüntülü aramalardaki her kareyi çözümleme ediyor. Bu sayede, ortamdaki insan benzeri değişik nesneleri verimli bir halde izleyebiliyor. Portal ve daha büyük boyutlu varyantı Portal+ şu an satışta bulunuyor sadece Facebook, Mask2Go ve akıllı kamera teknolojileri üstüne emek vermeyi bitirmiş değil. Şirket, Story Time adını verdiği artırılmış gerçeklik özelliği üstünde çalışıyor.
Camargo Story Time için “Fazlaca büyük bir potansiyeli bulunduğunu görüyoruz, artırılmış gerçeklik insanların birbirine bağlanmasına ve bağlı kalmasına destek olabilir” diyor.

