smk7758のはてなブログ

技術系の雑談やイベントについてを書きます。

3次元復元、画像処理における画像と空間の幾何的関係の基礎と用語

はじめに

初学者向けというか、FFさん用。ディジタル画像処理[改訂第二版]は本当に素晴らしく、今回はこの本の内容に沿って説明している。ぜひ買いましょう。

ピンホールカメラモデル

ピンホールカメラをモデル化したもの」(ピンホールカメラについては下記) 「光学中心(ピンホール位置)を通る光線だけで投影面への結像をモデル化している。モデルパラメータは、ピンホールから投影面までの距離である焦点距離f」 「また、光学中心を通り投影面に垂直な直線を光軸、光軸と投影面との交点を画像中心」

ピンホールカメラ

「ピンホール(針穴のように小さい穴)を空けた暗箱の内側に外界の風景が上下反転して映ることを利用した初期の写真機(カメラ)」 ピンホールカメラはピンホールのただ1点のみからしか光が入ってこないため、絞りが(無限大に)小さいとみなせばすべての距離でピントが合います。 対してレンズを使うと、集光させて明るく結像させることができる。

ピンホールカメラモデルの章は、ディジタル画像処理[改訂新版] p17, p18 (画像生成の幾何的モデル)より引用。

透視投影モデルと座標系とカメラキャリブレーション

カメラ座標系

「カメラの光学中心を原点とし、Z軸をカメラの光軸方向に一致させ、X軸とY軸は画像の横方向と縦方向に平行」にとった座標系。

ワールド座標系

「空間を表す座標系を一般化するために空間中の適当な位置」にとった座標系。

カメラ座標系、ワールド座標系については、ディジタル画像処理[改訂新版] p308, p309 (画像と空間の幾何的関係)より引用。

以降の説明については、母校で書いた論文を貼っつけておく(めんどい) カメラのパラメーターを求めるカメラキャリブレーションの話もついてる。 f:id:smk7758:20210918080222p:plain f:id:smk7758:20210918080224p:plain

余談

私が最初学んだときに取ったノートです。 f:id:smk7758:20210918081413j:plain f:id:smk7758:20210918081416j:plain f:id:smk7758:20210918081422j:plain

第53回 名古屋CV・PRML勉強会の報告

はじめに

4日間の名古屋を切って落としていった最初のイベントです。

4日間の名古屋とかについては、

smk7758.f5.si

のほうで。

あと、私のツイートを観ていただくと、大体の内容を察せられますのでリンクを張っておきます。 http://from:smk7758 since:2019-03-16_09:00:00_JST until:2019-03-16_21:00:00_JST #nagoyacv

CV・PRML

さて、名古屋CV・PRML勉強会ってなんぞやですが、 CV: Computer Vision(画像認識)と、 PRML: Pattern Recognition and Machine Learning(パターン認識機械学習) に関するプレゼンを聞く会で、中部大学の方々が中心でやっているっぽいです。

行く前に

まず面白かったのが場所です!!場所!!! Yahoo!の名古屋オフィスらしいのですが、なんとあの名駅タワーズの50F! タワーズとゲートで迷って若干遅れかけたのは内緒です。

Yahoo!の方にエレベーターで連れて行っていただいたのですが、そのエレベーターの気圧の変化にめちゃめちゃ驚きました。(田舎がバレる)

そして、会場についた時の眺め!めちゃめちゃ凄いです!!

名古屋城が下に見えるし、視界の6割ぐらいは空!

内容の感想

1stプレゼン

荒木諒介 「楽しい研究のために今からできること ~新しく研究を始める皆さんへ~」

自分も部活で研究をしているのでめちゃめちゃ同意しかない内容でした。 特に、雑談をするとそれぞれの問題がわかることはもちろん、休憩にもなるというところは楽しくやってる私達が思い出され、わかる!って内心思っていました。

研究はやっぱり誰にとっても大変ですけど、切り替えるとか休憩するとか、大事だと思いました。

2ndプレゼン

大西剛史 「ROSを使ったロボットによる研究環境の準備」

ROSというものについて聞きました。 ROSっていうのは、ロボット動かす時に使う感じで、画像認識で言うOpenCV的な立ち位置っぽそうです。

特に自動運転のときで使えるらしい仮想空間は面白そうだと思いました。

(ただロボット系はお金がかなりかかるっぽいので…)

3rdプレゼン

Yahoo!社員の方によるプレゼン

先日のGoogleMap弱体化にかかってるわけじゃないですが、 Yahoo!地図上での駐車場の空き具合とかを見れるようにするための話でした。

大手と提携を結んでいる半分ぐらいは見れるそうなのですが、個人のところだとかはネットと繋がっておらず(IoT?)、そういう場所の情報を取得する方法に画像認識を使っているという話です。

詳しく言えば、実験として運送業の車にカメラを取り付け、駐車場の標識(Pとか空・満とか)を機械学習を用いて認識しているそうです。(機械学習わからん!)

先進的な取り組みで、今までYahoo!さんはあんまり印象なかったのですが、GoogleMapの件と相まって、Yahoo!さんの評価がつきました。

4thプレゼン

福井宏 「最近の研究情勢についていくために - Deep Learningを中心に - 」

1stプレゼンと少々似た内容もありましたが、DLの話はDLをやってる後輩に伝えたいなぁという感じです。(おすすめ本など) 特に、勉強は大事!というメッセージは強く残ってます。

5thプレゼン

来栖川電算 教師データ作成ツール AnnoFab

機械学習なんもわからんで正直なにもわからなかったのですが、アノテーションというものを楽にするらしいです!

6thプレゼン

榎本憲二 「研究効率化のための自作ツール紹介」

自分はWindowsでコンソールを使わないので、流しつつ聞いてましたが、自分の先輩には使いやすそうな感じでした。(記憶がちょっと薄い!)

全体の感想

CVに関する様々な発表を聞けて、こういう世界があるんだ!と嬉しかったです。(普段はCVをやってる人たちと関わりがないので)

特にYahoo!さんの活動を知らなかったので驚きを受けました。 もちろん、オフィスの綺麗さ・眺めの良さも驚きを受けましたが!

自分の学校での研究はもうそろそろ終わりを告げますが、来年の後輩にこういう会があることを伝えて行きたいです。

おまけ

ドーナツ美味しかったです!!