どんなものか
- ViTバックボーンに対して性能の高い自己教師あり学習器を提案した
- masked autoencoderを用いて事前学習したモデルのencoder部分を使って学習させると非常に高い性能を出せることを示した
画像のクラス分類に対してあるクラスの典型的な例(prototype)を示すことで予測に対する説明を行う手法。
説明手法としていくつかのsaliency maps手法が提案されてきた。本研究ではsaliency maps手法を評価するための実用的な方法論を提案する。