Evernote

[Evernote] 画像文字認識の裏側を探る

Evernote に入れた画像は、サーバーに送られた後、文字認識がかけられ、その認識された文字列が検索の対象になります。

名刺などを写真に撮って、Evernote に入れておけば、僅かな記憶から一枚の名刺を検索することができます。また、検索したときに思わぬ点と点の繋がりが生まれる可能性もあります。

そんな画像の文字認識結果を知りたいと思いませんか?

画像の文字認識結果を調べる方法

去年、枯らしてしまった食虫植物ハエトリソウの説明書が、Evernote に入ってましたので、これで試しに確認してみます。

Evernote でノートを選択して、「右クリック」→「ノートのエクスポート…」を選択します。後は、手順に従って好きな場所に保存します。フォーマットは、Evernote XML フォーマット(.enex)です。

ここでは、デスクトップクライアントで、Mac 版 Evernote を利用していますが、Windows 版でも可能だと思います。

後は、出力されたファイルをテキストエディタで開きます。

ドラッグ&ドロップが簡単です。僕は、CotEditor というテキストエディタで開いてみました。

で、開いたテキストエディタの最下層辺りに、<t> タグで囲まれている文字列が、Evernote が画像から文字認識したテキストとなります。

結果は、下図。

「捕虫葉は素早い動きで虫を捕らえます」と結果が出ており、完全一致と素晴らしい結果。

印刷して出力した綺麗な文字だと認識能力が半端ないですね。

色んな画像で文字認識を試してみた

ここからは、Evernote に放り投げた写真からピックアップして、文字認識結果を調べてみました。

大阪行ったときに撮影した心斎橋駅の、文字認識結果。

「心斎橋」

小学生の時に流行した忌々しきワード。

ねえちゃんと瓜かってるって。

何かスピリチュアルなミジンコの文字認識結果。

「ミシンコ」と惜しい感じです。

鼻血ブロガー的写真の文字認識結果。

なんだかコーンラーメンっぽい感じの認識です。

他にも暗号っぽい文字列が認識されており、このことから、僕があの場で鼻血が出たのは怪電波を垂れ流す宇宙人の仕業に違いないことが判明。

おわりに

一枚の画像は、数千文字にも匹敵する表現能力を有しているといいますが、そのとおりと言わざるを得ないです。

手書きの認識は人間でも難しいので、コンピュータにやらせてもそりゃ難しいのですが、PCで出力された文字の認識精度はなかなか神がかっている感じです。

これからもばんばん Evernote に投げて、未来の僕になんじゃこりゃと言わせたいですね。