ai影象識別技術的應用(AI影象識別技術原理)
德國研究團隊給出一個原因,這個原因出乎意料:人類會關注圖中物件的形狀,深度學習計算機系統所用的演算法不一樣,它會研究物件的紋理。
首先人類向演算法展示大量圖片,有的圖片有貓,有的沒有。演算法從圖片中找到“特定模式”,然後用模式來做出判斷,看看面對之前從未見過的圖片應該貼怎樣的標籤。
神經網路架構是根據人類視覺系統開發的,網路各層連線在一起,從圖片中提取抽象特點。神經網路系統通過一系列聯絡得出正確答案,不過整個處理過程十分神祕,人類往往只能在事實形成之後再解釋這個神祕的過程。研究人員修改圖片,欺騙神經網路,看看會發生什麼事。研究人員發現,即使只是小小的修改,系統也會給出完全錯誤的答案,當修改幅度很大時,系統甚至無法給圖片貼標籤。還有一些研究人員追溯網路,檢視單個神經元會對影象做出怎樣的反應,理解系統學到了什麼。
德國圖賓根大學科學家Geirhos領導的團隊採用獨特方法進行研究。去年,團隊發表報告稱,他們用特殊噪點干擾影象,給影象降級,然後用影象訓練神經網路,研究發現,如果將新影象交給系統處理,這些影象被人扭曲過(相同的扭曲),在識別扭曲影象時,系統的表現比人好。不過如果影象扭曲的方式稍有不同,神經網路就無能為力了,即使在人眼看來影象的扭曲方式並無不同,演算法也會犯錯。當你在很長的時間段內新增許多噪點,圖中物件的形狀基本不會受到影響;不過即使只是新增少量噪點,區域性位置的架構也會快速扭曲。研究人員想出一個妙招,對人類、深度學習系統處理圖片的方式進行測試。
演算法將影象分成為小塊,接下來,它不會將資訊逐步融合,變成抽象高階特徵,而是給每一小塊下一個決定,比如這塊包含自行車、那塊包含鳥。再接下來,演算法將決定集合起來,判斷圖中是什麼,比如有更多小塊包含自行車線索,所以圖中物件是自行車。演算法不會考慮小塊之間的空間關係。結果證明,在識別物件時系統的精準度很高。