2014年11月19日 星期三

Google讓電腦更「了解」照片內容

聯合新聞網/記者楊又肇/報導

Google計畫應用圖像識別技術,配合人工智慧識別等技術,讓電腦系統能自動識別照片影像內容,並且透過認知系統為照片加上相關文字描述,進一步應用將可配合文字轉語音等技術,協助視障者了解影像內容,或應用在人工智慧與機械學習。而相關技術應用,史丹佛大學也已經投入研發內容。

Screen Shot 2014-11-17 at 2.11.11 PM_resize

根據<a href="http://redirect.viglink.com?key=11fe087258b6fc0532a5ccfc924805c0&u=http%3A%2F%2Fgoogleresearch.blogspot.tw%2F2014%2F11%2Fa-picture-is-worth-thousand-coherent.html%22%3EGoogle%E5%85%AC%E5%B8%83%E6%B6%88%E6%81%AF%3C%2Fa%3E%EF%BC%8C%E8%A1%A8%E7%A4%BA%E7%9B%AE%E5%89%8D%E6%AD%A3%E8%91%97%E6%89%8B%E7%A0%94%E7%A9%B6%E5%8F%AF%E7%B5%90%E5%90%88%E5%9C%96%E5%83%8F%E8%AD%98%E5%88%A5%E3%80%81%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7%E8%BE%A8%E8%AD%98%E7%AD%89%E6%8A%80%E8%A1%93%EF%BC%8C%E8%AE%93%E9%9B%BB%E8%85%A6%E7%B3%BB%E7%B5%B1%E8%83%BD%E8%87%AA%E5%8B%95%E8%AD%98%E5%88%A5%E7%85%A7%E7%89%87%E5%BD%B1%E5%83%8F%E5%85%A7%E5%AE%B9%EF%BC%8C%E9%80%8F%E9%81%8E%E8%AA%8D%E7%9F%A5%E7%B3%BB%E7%B5%B1%22%E4%BA%86%E8%A7%A3"照片內容後,即可自動加上文字描述。

目前此項技術仍處於前期測試階段,暫時還無法完全正確做出精準描述內容,史丹佛大學方面也已經投入相關研發內容,預期未來將能進一步協助視障者使用電腦操作服務等應用,甚至也能進一步應用在人工智慧記憶或機械學習等範圍,或是協助更精準的圖像搜尋比對。

相關技術主要建立在影像內容分析,並且讓系統清楚識別影像中主要物件、相對位置、互動關連,以及可能代表含意等,同時目前分析影像來源包含Pascal、Flickr8k、Flickr30k與SBU等開放影像資料庫內容,讓系統能藉由大量影像數據學習如何正確識別物件,並且配合在地語言轉換成最佳文字描述內容。

image01

螢幕快照 2014-11-19 下午12.00.05_resize

※相關連結》

‧A picture is worth a thousand (coherent) words: building a natural description of images (Google研究官方部落格)

更多資訊在http://diypc.gamefyr.com