自分の課題を行ってみる. まずは学習データというか教師データというか、「この状態がこうだよ」という正解データを作る.
ここでは画像に対して行いたく、その定義づけに「labelImg」を使う.

anaconda3環境の土台(base)に直接置きたくはないので、環境(LabelImg)を別途作る. 作成後にその環境に移ります

(base) [illya@centos7 ~]$ conda create -n LabelImg python=3.6
 
(base) [illya@centos7 ~]$ conda activate LabelImg
(LabelImg) [illya@centos7 ~]$

っで、labelImgをインストールします

(LabelImg) [illya@centos7 ~]$ pip3 install labelImg
 
(アプリ起動)
(LabelImg) [illya@centos7 ~]$ labelImg

下図はXming経由でwindowsPCで表示したものです.
2022y05m21d_074237159.png

っで何かいいサンプルがないかと調べたら https://www.tensorflow.org/datasets/catalog/bccd がある. 血球検出用の小規模データセット
gitで取得して調べてみた.

(base) [illya@centos7 ~]$ git clone https://github.com/Shenggan/BCCD_Dataset
(base) [illya@centos7 ~]$ cd BCCD_Dataset/
(base) [illya@centos7 BCCD_Dataset]$ ls -CF
BCCD/  dataset/  example.jpg  export.py  LICENSE  plot.py  README.md  scripts/  test.csv
(base) [illya@centos7 BCCD_Dataset]$ cd BCCD/
(base) [illya@centos7 BCCD]$ ls -l
total 32
drwxrwxr-x. 2 illya illya 12288 May 21 08:28 Annotations
drwxrwxr-x. 3 illya illya    18 May 21 08:28 ImageSets
drwxrwxr-x. 2 illya illya 12288 May 21 08:28 JPEGImages
 
(base) [illya@centos7 BCCD]$

この「JPEGImages」には血球の画像が 364枚 あります.
「Annotations」には画像に対応してこの部分は 白血球(WBC: White Blood Cell)、この部分は 赤血球(RBC: Red Blood Cell)、血小板(Platelets)とxmlで記載されたファイルがあります.
これら2つのファイルをLabelImgで表示すると下図のようになる. なので自分で正解データを作らなくてもこれを使ってモデルを作ればいい感じ.
2022y05m21d_090321825.png

っで、実際のLabelImgでこれらの開き方ですが、まず左メニューボタンの「Open Dir」をクリックしてgitで取得したフォルダの「BCCD」を選ぶ
2022y05m21d_093747604.png
この段階で画像が表示されるかと. それとLabelImgの右下File Listにイメージファイルが列挙される
その後、同じく左メニューから「Change Save Dir」をクリックして、「BCCD」フォルダ内の「Annotations」を選ぶ
2022y05m21d_094125903.png
その後に矢印ボタンを押下すれば前述の画像とイメージが合わさった表示なります
2022y05m21d_094225638.png
LabelImgの右側の各領域名をクリックすると、それに該当する部分がハイライトされます.
2022y05m21d_094412459.png

改めてすごいデータです. アノテーションされた方に深く感謝です

一度この操作を行うと「$HOME/.labelImgSettings.pkl」ファイルが作られる. LabelImgが読み込むファイルなのだが、PATH情報とかこれに記載されてしまうので、別のものをするならこれを削除するのがいいかもしれない.


トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2022-05-22 (日) 09:54:06 (35d)