常用影象標註方法有哪些(常見的影象標註型別有哪些)
資料標註乾貨/新鮮AI資訊盡在——
微信公眾號【資料標註星球】
影象標註就是將標籤附加到影象上的過程。這可以是整個影象的一個標籤,也可以是影象中每一組畫素的多個標籤。
市場對影象標註精準度愈發嚴格,同時針對不同的應用場景,也衍生出了不同的影象標註方法。
語義分割
語義分割是指根據物體的屬性,對複雜不規則圖片進行進行區域劃分,並標註對應上屬性,以幫助訓練影象識別模型。語義分割則需要按照語義用自定義畫框對交通場景中的圖片進行分割槽,區分出圖片中的行人、車輛、道路、標識、樹木、建築物等。常應用於自動駕駛、人機互動、虛擬現實等領域。
矩形框標註
矩形框標註又叫拉框標註,拉框標註是影象標註中極為常見的一種任務型別,主要是指用2D框、3D框、多邊形框等標註出影象中的指定目標物件。
多邊形標註
多邊形標註是指在靜態圖片中,使用多邊形框,標註出不規則的目標物體,相對於矩形框標註,多邊形標註能夠更精準地框定目標,同時對於不規則物體,也更具針對性。
關鍵點標註
關鍵點標註是指在目標物件的規定位置打上關鍵點,例如在人臉圖片上用點標註出眼角、鼻尖、嘴角等關鍵位置或者在人體影象上標出骨骼或穴位的位置等。
立方體標註
將2D圖片中的車輛進行3D標註,主要應用於訓練自動駕駛對會車或超車車輛的體積判斷。
3D點雲標註
3D點雲標註是指從鐳射雷達採集的點雲圖中找出目標物件,並以立方體框的形式標註出來,其中包括車輛、行人、廣告標誌和樹木等。
2D/3D融合標註
2D/3D融合標註是指同時對2D和3D感測器所採集到的影象資料進行標註,並建立關聯。該方法能夠標註出物體在平面和立體中的位置和大小,幫助自動駕駛模型增強視覺和雷達感知。
目標追蹤
目標跟蹤是從視訊資料中按幀捕捉某一物件,並進行畫框標註。在軍事制導、視訊監控、機器人視覺導航、人機互動,以及醫療診斷等許多方面有著廣泛的應用前景。
OCR轉寫
OCR轉寫是對影象中的文字內容進行標記與轉寫,幫助訓練和完善圖片與文字識別模型。
屬性判別
屬性判別是指通過人工或機器配合的方式,識別出影象中的目標物體,並將其標註上對應屬性。
來源:公眾號【資料標註星球】