複数カメラ、人物検出、照合、行動把握 (4)

雑踏の映像を見ていて思ったこと。
カメラの画素数ってかなり少ない。もちろん静止画と比べるとだけど。これは技術でなんとかなるのかもしれない。技術進歩で画質が上がるとなると、コリログラムやヒストグラムは過渡的な方法でしかなくなる。将来的にはほとんど使われなくなるものだ。
カメラごとの人の照合を、自分なら頭の中でどう処理しているかを考えてみた。すると、背の高さ、髪形、靴の色、服の模様、歩き方、持っているカバンの柄、太り方、別カメラでペアで歩いていたかどうか、髪の毛の色、顔の特徴、足の細さ、髪の飾り、眼鏡の有無、帽子の種類、服を抱えている、ひげ、会話している、マスクをつけている、走っている、マフラーしている、キャリーケースを引いているなどを照合して、それに違いがないかどうかを判断している。分からないところは保留にしている。違いがあったら、あれ?と考えて、その理由を考える。別の人であるか、同じ人が合理的な理由で変化したかだ。髪が乱れた、靴を脱いだ、服を着た、歩き方を変えた、カバンを右左持ち替えて見える面が変わった、横から見ると太かった、ペアで歩いていたのがさよならした、光が当たる加減が変わった、表情がかわった、足が太くなった?、髪の飾りがとれた、サングラスをはずした、帽子をはずした、服を着た、ひげをつけた?、会話が終わった、マスクを外した、息切れした走るのをやめた、マフらーを外した、キャリーケースを預けたなどが生じる確率から、不自然なほどでなければ納得して、その人の情報を更新する。
http://www.eml.hiroshima-u.ac.jp/member/staff/tamaki/study/prmu2003-242.pdf
http://www.eml.hiroshima-u.ac.jp/member/staff/tamaki/study/prmu2004-186.pdf