日本大百科全書(ニッポニカ)

文字認識
もじにんしき
character recognition 英語

手書き文字や印刷物の文字画像を観測し、パターン認識により文字種を判定する操作であり、光学式文字読取り装置(OCR:optical character reader)とよばれるシステムの基盤となる技術。アナログ情報である紙の上の文字をデジタル情報に置き換えるシステムは、コンピュータの登場時から求められ、実用化に向けエネルギーが注がれてきた。
 郵便番号自動読取区分機(1968)は、世界で初めて実用化された自由手書き数字の文字認識システム。定位置の赤枠に記された3桁の数字、という制限をかけることで、演算処理にかかる時間を短縮した。
 文字認識のシステムは、辞書を参照しながら単語やフレーズのマッチングを行い文字列の意味を解析する方向や、静止画や動画などから文字情報を抽出し情報を取得する方向などに進化している。
[編集部]2020年1月21日