透明かつ正確な分類を行えるSCOUTER(Slot-based COnfigUrable and Transparent classifiER)と呼ばれるスロット注意機構に基づく分類器を提案した。
またSCOUTERに合わせた新しい損失を設計し、正負の説明や説明領域の大きさも制御できるようにした。
論文Figure 1: 肯定的な説明と否定的な説明の例
本手法の説明性は注意機構ベースの説明性を用いている。
他の注意機構ベースの説明性手法との大きな違いは
論文Figure 2: 分類パイプライン。(a)分類モデルの概観。(b)SCOUTERのxSlot Attentionモジュール。
分類モデルは通常特徴抽出器と分類器からなっている。ここで分類器の部分をSCOUTER(xSlotモジュール)に置き換え、SCOUTER損失で学習する。
xSlotモジュール
SCOUTER用に調整されたスロット注意機構であり、xSlotモジュールの各スロットはカテゴリと関連づけられている。スロット注意機構ではカテゴリlのために直接関連する画像内のサポートS_iを見つける。
SCOUTER損失
基本的にはクロスエントロピー損失であり、正則化項としてサポート領域の面積を制御する項が追加される。
視覚的説明の品質の評価指標としてImageNet内のバウンディングボックスを物体領域の代理として用い、説明全体の総画素数に対するバウンディングボックス内に位置する画素数の割合として用いる。
またそのほかの指標としていくつかの論文で使われている指標を用いた。
その結果が以下のtable 1である
論文 Table 1 : いくつかの指標についての結果をまとめた表
SCOUTERの欠点の一つとしてクラス数が増えると学習が不安定になることがあげられる。よって適用対象は中小規模のデータセットに限定される。