據(jù)悉,微軟在此次比賽中所使用的系統(tǒng)名為“圖像識別深度殘差學習”(Deep Residual Learning for Image Recognition),該系統(tǒng)由微軟研究員何愷明、張祥雨、任少卿和孫劍(均為音譯)組成的團隊開發(fā)。微軟在官方博客中表示,公司將在今后發(fā)表的論文中詳細對外介紹這一系統(tǒng)。
“我們對神經(jīng)網(wǎng)絡的訓練深度已經(jīng)超過了150層,而這一‘深度殘差學習’框架能夠進一步減少優(yōu)化,同時整合極深度網(wǎng)絡,圖像識別的準確率也就會迎來提升。而且,這種準確率的提升是許多其他普通網(wǎng)絡所無法做到的。”一名微軟研究員如是說道。
應該說,圖像識別技術近期已經(jīng)得到了越來越多公司的追捧,因為他們都希望借這一系統(tǒng)改善內(nèi)部系統(tǒng)及面向消費者的產(chǎn)品。
值得一提的是,微軟此前已經(jīng)通過幾款有趣的應用幽默化的展示了公司在這一領域的實力,比如該公司發(fā)布了“我看起來有多大”(How Old Do I Look?)以及“我的胡子怎么樣”(How’s My Moustache Doing?)這兩款妙趣橫生的應用。同時,微軟還通過微軟研究院發(fā)起的“牛津項目”(Project Oxford)試圖將這一圖像識別技術真正實現(xiàn)商業(yè)化。
據(jù)悉,第六屆“ImageNet圖像識別大賽”要求參賽方對來自分享網(wǎng)站Flickr和搜索引擎的10萬張照片進行精確定位,并將他們劃分到1000種目標類別下,其中包括狼蛛、iPod、清真寺、玩具店和調(diào)制解調(diào)器等。比賽中,微軟系統(tǒng)的分類錯誤率僅為3.5%,定位錯誤率則為9%。
而在過去幾年,谷歌、初創(chuàng)企業(yè)larifai和NEC則一直在圖像分類準確率方面取得了不錯的成績。
對此,微軟研究院的一名研究人員表示:“甚至連我們自己都敢不相信這一方案能夠取得這么好的成績。”
值得一提的是,中國互聯(lián)網(wǎng)企業(yè)百度并未參與今年的“ImageNet圖像識別大賽”。這主要是因為百度在去年的測試中存在嚴重違規(guī)行為,該公司隨后對此表示道歉,并解雇了要求初級工程師這樣做的團隊負責人。
當時,美國網(wǎng)站MIT科技評論還特地撰文對百度在人工智能測試中違規(guī)一事作出評論。該網(wǎng)站指出,相對于其他公司一周只購買2張彩票而言,百度的行為如同一周“購買了200張彩票”,此舉大大增加了其中獎概率。此后,主辦方對百度作出了禁止提交測試成績1年的處罰。
相關閱讀