OCR(文字認識)とは?|わかりやすく説明|基本の【き】
この記事の目次
OCR(文字認識)とは?
OCRとはどんな技術?OCRで何が出来る?
OCRとは印刷された文字や手書きの文字などをカメラやスキャナといった光学的な手段でデータとして取り込み、それを解読(文字認識)することによって一度印刷されてしまった文字をパソコンなどのコンピューターが利用できる文字(テキスト)データに変換する技術です。
データ入力作業の手間を大幅に削減し2重入力や人的ミスの削減などを目的としたOCRの利用はビジネス用途にも広く浸透しており、流通・製造・医療・小売などあらゆる業界で本来は人が読むために印刷された【文字】をコンピューターに取り込みたいといった要望が根強くあり、バーコードや2次元コードが普及した現在でもOCRの需要はむしろ高まる傾向にあります。
OCRにはOCRリーダーが必要?
OCRには文字を読み込むためのカメラと文字を識別するためのソフトウェアを組み合わせたOCRリーダーを使用します。 ※動画:バーコードリーダーをOCRリーダーに用いた場合
運用には読み取り対象や処理するデータ量、オフィスや工場などの運用環境やデータ出力の方法といった用途により最適なOCRリーダーを選ぶ必要があります。
OCRリーダーの種類に関してはこちらの記事:【OCRリーダーの種類|それぞれの特徴は?】にまとめておりますので合わせてお読みください。
OCRの読み方?日本語は?
OCR=Optical Character Recognition=光学文字認識
OCRは【Optical Character Recognition】の頭文字を取ったもので、「オー・シー・アール」と読みます。
日本語ではこの【Optical Character Recognition】を訳し、【光学文字認識(こうがくもじにんしき)】(Optical=光学的な Character=文字 Recognition=認識)と表記される場合がありますが、【OCR】という名称が用いられることが多いです。最近では【光学】を除き、【文字認識】と表現されることも増えてきています。
OCRの歴史|いつ開発された?
世界初のOCRシステム GISMO
アメリカ人の発明家であり暗号解析の専門家でもあったDavid Hammond Shepard氏によって、1951年に世界で初めてOCR技術を使ったシステム=GISMOが開発されました。Shapard氏の余暇の時間にGISMOの開発が行われたようで、氏はOCRシステムの他にも現在クレジットカードの裏面に多く使用されている【Farrington B numeric】というフォントの制作もされました。
※参考
https://tedium.co/2017/03/22/ocr-typography-optical-character-recognition-history/
http://www.historyofinformation.com/detail.php?entryid=885
日本語のOCRが実用化され初めたのは最近?
英語圏で主に使用される数字とアルファベットであれば36キャラクターのみとなりOCR処理数は少なく済みますが、漢字は2010年に公表された現在の常用漢字だけでも2136字、数字やアルファベットなどのOCRと違い画数も多いため、日本語のOCR処理の難易度が格段に高く、海外に比べその難易度が開発と発展の妨げになっていました。
OCRの今後
AIを活用したOCRや文字認識のディープラーニング
この数年でOCR処理を行うパソコンの性能が格段に上がったことで、OCRを処理を行うプログラム=OCRアルゴリズムがより高度な計算を行うことが可能となりました。今後のOCRのトレンドとしてはAIを活用したOCR】やディープラーニング技術といったキーワードが増えていくことでしょう。