実践コンピュータビジョンを買った。

週末に、動画について顔検出をして、笑い男マークを上書きするというコードを書き終えた。
ネット上に笑い男(静止画)の上書きについては落ちていたので、外周の文字部分が回転するバージョンのコードを書いてみました。
といっても簡単なもので、1フレームごとに2度回転させるというだけ。フレームごとの検出された顔の対応をとるということだけで特に難しいことなく書けました。

ということで、そろそろきちんと画像処理周りの勉強を進めるための参考書を週末に探した。
O'reillyの、「実践 コンピュータ・ビジョン」にするか、「詳解 OpenCV」にするか。
前者はOpenCVというよりは、画像認識の基礎理論を学ぶ。OpenCVについては最終章のみ。
後者はまさにOpenCVの使い方について。

基礎部分も目を通しておきたかったので、土曜日に「実践 コンピュータビジョン」を購入。
1章が終わりました。NumPy, Matplotlib, Scipyの使い方について。Pythonの基本ツールについてという感じですね。後半は画像を数学的にどのように扱うのか、の初歩的な内容。輝度について微分することで境界を検出するとか、画像認識の分野に初めて触れる身としてはなるほどねーという感じ。一方、この分野の全くの初学者には、懇切丁寧に書かれている、とは言えないかも。記述子ってなんやねん、とか。

今、2章の特徴点抽出について。
Harrisコーナー検出器について。そもそも、エッジとは、コーナーとは、の基本的な考え方は、こちらのスライドの7ページ目からがとてもわかりやすいですね。
http://www.mi.t.u-tokyo.ac.jp/harada/lectures/IIT/internal/04_detector_descriptor_20160511.pdf
今まで、Pythonでの行列演算は特にやってこなかったので、記述式にまだ慣れない。

特徴点抽出は、カメラ画像についてフレーム間の対応をとって、画面内の物体の動きをトレースしたりするために使うのかな??
 
 SIFTについて。本書の範囲を超えるので外のライブラリを使うとのことで、めんどくさかったので
 https://www.blog.umentu.work/python3-opencv3%E3%81%A72%E3%81%A4%E3%81%AE%E7%94%BB%E5%83%8F%E3%81%AE%E4%B8%80%E8%87%B4%E3%81%99%E3%82%8B%E7%89%B9%E5%BE%B4%E3%82%92%E7%B7%9A%E3%81%A7%E7%B5%90%E3%81%B6/
 を参考に。opencvの中に特徴量のライブラリもあるようなので、早いところopencvまで進んだほうがいいのか??