読者です 読者をやめる 読者になる 読者になる

しえログ

qiita との使い分けに悩んでる

ECCV 2014 の Large-Scale Object Classification using Label Relation Graphs パラ読みして諦めたメモ

論文 機械学習 コンピュータビジョン

概要

  • 既存モデルを一般化する統合物体分類フレームワークを提案
    • 同じオブジェクトにつけられた複数のラベルの関係性に基づき、現実世界のより豊かな構造表現を抽出する
    • HEX グラフというグラフ構造を定義し、CRF(Conditional Random Field) 的な確率的分類モデルを提案
  • 評価データセットは ILSVRC2012
    • zero-shot learning も達成
  • 最大の貢献ポイントは理論面

参考スライド

コンピュータビジョン勉強会での takmin さんの発表資料。

所感

とにもかくにも定義が多すぎてメモしていかないと理解しながら読み進められないし実際挫折した。 もうちょいリファレンス論文読んだりグラフ理論とか確率周りの知見もつけてからもっかい読みたい。

次読みたいリファレンス

階層構造まわり

  • Tousch, A.M., Herbin, S., Audibert, J.Y.: Semantic hierarchies for image annotation: A survey. Pattern Recognition 45(1), 333–345 (2012)
  • Fergus, R., Bernal, H.,Weiss, Y., Torralba, A.: Semantic label sharing for learning with many categories. In: Computer Vision–ECCV 2010, pp. 762–775. Springer (2010)
  • Hwang, S.J., Sha, F., Grauman, K.: Sharing features between objects and their attributes. In: Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. pp. 1761–1768. IEEE (2011)

構造予測による階層アノテーション

  • Lampert, C.H.: Maximum margin multi-label structured prediction. In: NIPS. vol. 11, pp. 289–297 (2011)
  • Bi, W., Kwok, J.T.: Mandatory leaf node prediction in hierarchical multilabel classification. In: NIPS. pp. 153–161 (2012)
  • Bi, W., Kwok, J.T.: Multi-label classification on tree-and dag-structured hierarchies. In: Proceedings of the 28th International Conference on Machine Learning (ICML-11). pp. 17–24 (2011)