在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機(jī)視覺注釋工具！

宇宙一級潛在鴿王 2021-08-25 09:57:56 瀏覽數(shù) (2603)

反饋

計算機(jī)視覺是人工智能的一個子集，專注于教機(jī)器如何正確解釋來自圖片、視頻幀和其他來源的數(shù)據(jù)。我們通常需要使用帶注釋的數(shù)據(jù)來監(jiān)控深度學(xué)習(xí)模型，以利用當(dāng)代計算機(jī)視覺技術(shù)。為了使用對象檢測和識別等計算機(jī)視覺技術(shù)，需要使用這些對象的特定圖像實例訓(xùn)練 ML 模型并標(biāo)記它們。

以下是五種常用的計算機(jī)視覺注釋工具，用于對訓(xùn)練數(shù)據(jù)集進(jìn)行對象識別和標(biāo)記。

視覺工具流程圖解

1. ?LabelImg? : LabelImg 是一個開源的用于圖像處理和標(biāo)注的標(biāo)注工具。它是用 ?Python ?開發(fā)的，并有一個用 Qt 構(gòu)建的圖形用戶界面。這是一種快速且免費的圖像標(biāo)簽方式。使用此標(biāo)記工具完成的注釋以 PASCAL VOC XML 格式保存。

2. ?Computer Vision Annotation Tool (CVAT)?：Computer Vision Annotation Tool (CVAT) 是由 Intel 創(chuàng)建的免費圖像標(biāo)記程序。它也是開源的，使用 ?CSS?、?Python?、?Django?、?TypeScript ?和 ?React ?等編程語言編寫。CVAT 有助于監(jiān)督學(xué)習(xí)任務(wù)，如對象檢測、圖像分割和分類等。 CVAT 提供強(qiáng)大的功能，可以利用深度學(xué)習(xí)模型進(jìn)行半自動注釋。

3.視覺對象標(biāo)記工具（?VOTT?）：微軟團(tuán)隊創(chuàng)建了一個視覺對象標(biāo)記工具（?VOTT?）來使用計算機(jī)視覺識別和注釋視頻和圖像，并使用 TypeScript 進(jìn)行編程。如果你的數(shù)據(jù)存儲在 Azure Blob 存儲中或者你正在使用 Bing 圖像搜索，你可以直接通過他們的網(wǎng)站使用 VOTT。使用每個版本的安裝包是本地安裝 VoTT 的最便捷方式。適用于 Mac OSX 的 VoTT、適用于 Linux 的 VoTT 和適用于 Windows 的 VoTT 均作為安裝包提供。

4. ?Labelme?：Labelme是麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室于2012年開發(fā)的開源標(biāo)注庫，它有助于使用圓形、矩形、三角形、點、線和線條對圖像進(jìn)行標(biāo)注。Labelme 是使用 Python 編寫的，對于圖形界面，它使用 Qt。使用 Labelme 可以輕松完成語義分割、邊界框和圖像分類。

5. ?RectLabel? : RectLabel 是一個圖像標(biāo)注工具，用于標(biāo)注圖片以識別和分割邊界框?qū)ο?。此圖像注釋工具可自動與一些核心 ML 模型配合使用，無需任何其他實現(xiàn)。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多邊形、邊界框、線、點和三次貝塞爾曲線繪制關(guān)鍵點。您還可以自定義標(biāo)簽對話框，以便它可以與特征一起使用。RectLabel 可以導(dǎo)出為 YOLO、COCO JSON 和 CSV 格式。這樣，用戶還可以導(dǎo)出索引掩碼圖像和分離的掩碼圖像，同時還可以執(zhí)行圖像調(diào)整大小和增強(qiáng)等任務(wù)。

Python 大數(shù)據(jù) 人工智能工具

0 人點贊

在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機(jī)視覺注釋工具！

在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機(jī)視覺注釋工具！