SCOUTER: Slot Attention-based Classifier for Explainable Image Recognition
reading papers

どんなものか

透明かつ正確な分類を行えるSCOUTER(Slot-based COnfigUrable and Transparent classifiER)と呼ばれるスロット注意機構に基づく分類器を提案した。

またSCOUTERに合わせた新しい損失を設計し、正負の説明や説明領域の大きさも制御できるようにした。 論文Figure 1: 肯定的な説明と否定的な説明の例

論文Figure 1: 肯定的な説明と否定的な説明の例

先行研究と比べて

本手法の説明性は注意機構ベースの説明性を用いている。

他の注意機構ベースの説明性手法との大きな違いは

技術や手法のポイント

論文Figure 2: 分類パイプライン。(a)分類モデルの概観。(b)SCOUTERのxSlot Attentionモジュール。

論文Figure 2: 分類パイプライン。(a)分類モデルの概観。(b)SCOUTERのxSlot Attentionモジュール。

分類モデルは通常特徴抽出器と分類器からなっている。ここで分類器の部分をSCOUTER(xSlotモジュール)に置き換え、SCOUTER損失で学習する。

検証方法

視覚的説明の品質の評価指標としてImageNet内のバウンディングボックスを物体領域の代理として用い、説明全体の総画素数に対するバウンディングボックス内に位置する画素数の割合として用いる。

またそのほかの指標としていくつかの論文で使われている指標を用いた。

その結果が以下のtable 1である

論文 Table 1 : いくつかの指標についての結果をまとめた表

論文 Table 1 : いくつかの指標についての結果をまとめた表

議論

SCOUTERの欠点の一つとしてクラス数が増えると学習が不安定になることがあげられる。よって適用対象は中小規模のデータセットに限定される。

*****
Non sunt multiplicanda entia sine necessitate
Pudhina is a free Jekyll theme by Knhash.
copyright ©️ 2022 - 2024