JPH04182788A - Method and device for recognizing character - Google Patents
Method and device for recognizing characterInfo
- Publication number
- JPH04182788A JPH04182788A JP2312074A JP31207490A JPH04182788A JP H04182788 A JPH04182788 A JP H04182788A JP 2312074 A JP2312074 A JP 2312074A JP 31207490 A JP31207490 A JP 31207490A JP H04182788 A JPH04182788 A JP H04182788A
- Authority
- JP
- Japan
- Prior art keywords
- data
- byte
- image
- image information
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野コ
本発明は、傾きのある字体の文字認識も可能な文字認識
方法及び装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a character recognition method and apparatus that can also recognize characters with slanted fonts.
し従来の技術]
従来の文字認識装置は、一般に第4図のように構成され
ている。401は文字画像をアナログ電気信号に変換す
るスキャナ、402はスキャナからのアナログ信号を2
値化する2値化手段、403は2値化された画像データ
を記憶しておく画像メモリ、404は画像メモリ上の文
字列に対して1文字ごとに文字領域を取り出す文字切り
出し手段、405は予め定められたアルゴリズムに従っ
て文字固有の特徴を抽出する特徴抽出手段、407は4
05と同じ特徴抽出処理を学習用データに対して行った
結果得られる平均値や分散等の統計量を予め格納してお
く認識辞書、406は入力文字画像から得られた特徴量
を認識辞書の内容と比較し、最も距離の近い候補字種を
認識結果として選び出す照合手段、408は認識結果と
して候補字種のコードをデイスプレィや外部装置へ転送
する出力手段である。BACKGROUND ART A conventional character recognition device is generally configured as shown in FIG. 401 is a scanner that converts character images into analog electrical signals; 402 is a scanner that converts analog signals from the scanner into 2
403 is an image memory for storing the binarized image data; 404 is a character cutting means for extracting a character area for each character from the character string on the image memory; 405 is a Feature extraction means 407 extracts character-specific features according to a predetermined algorithm.
406 is a recognition dictionary that stores statistics such as average value and variance obtained as a result of performing the same feature extraction process on the learning data as in 05; A collation means compares the content and selects the closest candidate character type as a recognition result, and 408 is an output means for transmitting the code of the candidate character type as a recognition result to a display or an external device.
[発明が解決しようとしている課題]
第3図に欧文文字の例を示すが、文字には302のよう
に傾きのない字体(例えばローマン体)だけではなく、
301のように傾きのある字体(例えばイタリック体)
もあるが、従来の文字認識装置では301のような傾き
のある字体に対応する技術はなかった。よって、以下の
ような問題が生じる。[Problem to be solved by the invention] Figure 3 shows an example of Roman characters, but the characters include not only fonts with no slope (for example, Roman fonts) like 302, but also
Slanted fonts like 301 (e.g. italics)
However, conventional character recognition devices did not have the technology to handle slanted fonts like 301. Therefore, the following problems arise.
(1)隣り合う文字で重なりが生じ、1文字分の切り出
しデータに隣接文字の侵入が起こることがあり、誤認識
の原因となる。(1) Adjacent characters may overlap, and adjacent characters may intrude into the cutout data for one character, causing misrecognition.
(2)字体に合せて複数の認識辞書を持たなければなら
ず、認識辞書の為のメモリ容量が非常に多(必要となる
。(2) It is necessary to have multiple recognition dictionaries according to the fonts, and the memory capacity for the recognition dictionaries is extremely large.
(3)文字認識における一般的な特徴抽出アルゴリズム
では文字線の局所的な傾きを捕らえることに重点が置か
れる。(3) Typical feature extraction algorithms for character recognition focus on capturing the local slope of character lines.
したがって、傾きのある字体用の認識辞書を作成しよう
としても、水平・垂直の文字線が多い通常の傾きのない
文字用に最適化されたアルゴリズムでは、傾いた文字線
の多い文字の特徴を十分捕らえられないことが多い。Therefore, even if you try to create a recognition dictionary for slanted fonts, the algorithm optimized for normal, non-slanted characters with many horizontal and vertical lines will not be able to adequately recognize the characteristics of characters with many slanted lines. They are often not caught.
[課題を解決するための手段]
上記課題を解決するために本発明によれば、画像情報を
所望の態様にずらすことを指示し、前記画像情報を1列
分ずつ格納し、前記画像情報をずらすことが指示された
場合には、前記格納された画像情報をずらして転送する
よう制御することを特徴とする文字認識方法を提供する
。[Means for Solving the Problems] In order to solve the above problems, according to the present invention, an instruction is given to shift image information in a desired manner, the image information is stored one column at a time, and the image information is A character recognition method is provided, characterized in that, when a shift is instructed, the stored image information is controlled to be shifted and transferred.
上記課題を解決するために本発明によれば、画像情報を
所望の態様にずらすことを指示する指示手段と、前記画
像情報を1列分ずづ格納する格納手段と、前記指示手段
によって前記画像情報をずらすことが指示された場合に
は、該格納手段に格納された画像情報をずらして転送す
るよう制御する転送制御手段を有することを特徴とする
文字認識装置を提供する。In order to solve the above problems, according to the present invention, there is provided an instruction means for instructing to shift the image information in a desired manner, a storage means for storing the image information one column at a time, and a storage means for storing the image information one column at a time. A character recognition device is provided, characterized in that it has a transfer control means that controls to shift and transfer the image information stored in the storage means when an instruction is given to shift the information.
[実施例]
第1図(A)は本発明の実施例を示す構成図で、101
〜108は第4図の従来例のそれぞれ401〜408に
同じである。本実施例では、102の2値化手段と10
3の画像バッファの間にスキャナで読み取った1列分の
画像データを格納しておくテンポラリバッファ109を
設け、また字体の選択を行う字体選択手段110を有し
ている。[Example] FIG. 1(A) is a block diagram showing an example of the present invention, and 101
to 108 are the same as 401 to 408, respectively, of the conventional example in FIG. In this embodiment, 102 binarization means and 10
A temporary buffer 109 for storing one column of image data read by a scanner is provided between the three image buffers, and a font selection means 110 is provided for selecting a font.
第1図(B)は本実施例の構成を示すブロック図であり
、ここで第1図(A)の構成図との対応について説明す
る。FIG. 1(B) is a block diagram showing the configuration of this embodiment, and the correspondence with the configuration diagram of FIG. 1(A) will be explained here.
lはCPUであり、スキャナ8から読み取られた画像情
報を2値化する2値化手段102、その他の処理の制御
を行う。2はキーボード(KB)、3はポインティング
・デバイス(P、D、)であり、認識対象である文字の
書体を見てオペレータが字体を指示する字体選択手段1
10として用いられ、また、その他の作業の指示を与え
る為に用いる。4はリード・オンリー・メモリ(ROM
)であり、文字を認識する際に用いる認識辞書107を
予め記憶してお(。5はメモリであり、スキャナ101
から読み取られた画像情報を1列分ずつ一時的に記憶す
るテンポラリバッファ109及び画像メモリ103の役
割を果たす。1 is a CPU, which controls a binarization means 102 that binarizes image information read from the scanner 8 and other processing. 2 is a keyboard (KB), 3 is a pointing device (P, D,), and font selection means 1 where an operator specifies the font by looking at the font of the character to be recognized.
10, and is also used to give instructions for other tasks. 4 is read-only memory (ROM)
), and a recognition dictionary 107 used when recognizing characters is stored in advance (.5 is a memory, and the scanner 101
It plays the role of a temporary buffer 109 and an image memory 103 that temporarily stores image information read from the image data column by column.
6は文字の認識の主たる部分の計算を行う識別計算部で
あり、画像メモリ103のデータから文字の切り出しを
行う文字切り出し手段104、切り出されたデータから
その文字の特徴を抽出する特徴抽出手段105、抽出さ
れた特徴データを認識辞書107と照合する照合手段1
06の処理を行う。7はCRTであり、認識結果を出力
する出力手段108であり、認識結果が出る前の途中経
過や、オペレータへの指示を促すデータ等を表示する表
示手段である。8はスキャナ(SCAN)であり、第1
図(A)におけるスキャナ101に相当する。9はスキ
ャナ8とのインターフェイス、5CAN 1./Fで
ある。Reference numeral 6 denotes an identification calculation unit that performs calculations for the main part of character recognition, character extraction means 104 that extracts characters from data in the image memory 103, and feature extraction means 105 that extracts features of the characters from the extracted data. , collation means 1 for collating the extracted feature data with the recognition dictionary 107
06 processing is performed. Reference numeral 7 denotes a CRT, which is an output means 108 for outputting the recognition results, and is a display means for displaying the progress before the recognition results are output, data prompting instructions to the operator, and the like. 8 is a scanner (SCAN), and the first
This corresponds to the scanner 101 in Figure (A). 9 is an interface with the scanner 8, 5CAN 1. /F.
第2図にはテンポラリバッファ109と画像メモリ10
3のデータの例を示し、テンポラリバッファ109から
画像メモリ103へのデータ転送方法について説明する
。FIG. 2 shows a temporary buffer 109 and an image memory 10.
A method of transferring data from the temporary buffer 109 to the image memory 103 will be explained using an example of the data of No. 3.
まずスキャナ101で入力された画像データは、2値化
手段102において2値化される。この2値化は、画像
データ上の1画素は1ビツトに対応し、黒画素はビット
を1に、白画素はビットを0に変換する。First, image data inputted by the scanner 101 is binarized by the binarization means 102. In this binarization, one pixel on the image data corresponds to one bit, and a black pixel is converted to a bit of 1, and a white pixel is converted to a bit of 0.
第2図においては、201がテンポラリバッファ、20
2が画像メモリのデータの様子を各々表している。テン
ポラリバッファ201上のデータを上から順に第0バイ
ト、第1バイト、・・・、第iバイト、・・・と呼び、
バイト中では上側を下位バイト、下側を上位バイトとす
る。In FIG. 2, 201 is a temporary buffer, 20
2 represents the state of data in the image memory. The data on the temporary buffer 201 is called the 0th byte, 1st byte, . . . , i-th byte, . . . in order from the top.
Among the bytes, the upper side is the lower byte and the lower side is the upper byte.
まず、スキャナ101から入力され、2値化手段102
において2値化された画像データは、順次テンポラリバ
ッファ109に送られる。First, input from the scanner 101 is input to the binarization means 102.
The binarized image data is sequentially sent to the temporary buffer 109.
オペレータにより字体選択手段110から字体が傾いて
いるという指示が与えられないが、または字体が傾いて
いないということをCPUI或いは識別計算部6で判断
した時は、テンポラリバッファ109に1列分のデータ
が格納されるごとに画像バッファ103の第1列へとデ
ータを順次転送する。When the operator does not give an instruction that the font is slanted from the font selection means 110, or when the CPUI or identification calculation unit 6 determines that the font is not slanted, one column of data is stored in the temporary buffer 109. Data is sequentially transferred to the first column of the image buffer 103 each time the data is stored.
しかし、オペレータにより字体選択手段110がら字体
が傾いているという指示が与えられるが、または字体が
傾いているということをCPUI或いは識別計算部6で
判断した時は、テンポラリバッファ109から画像メモ
リ103へ転送するデータのずらし処理を行う。However, when the operator gives an instruction that the font is slanted from the font selection means 110, or when the CPUI or identification calculation unit 6 determines that the font is slanted, the data is transferred from the temporary buffer 109 to the image memory 103. Performs shifting processing of data to be transferred.
データのずらし処理は、テンポラリバッファ109から
画像メモリ103へのi回目の転送においてテンポラリ
バッファの第iバイトの下位バイトの内容は、画像バッ
ファ202の第(j+1x2)列の第iバトの下位バイ
トへ転送され、上位バイトの内容は第(j+ix2+1
)列の第iバイトの上位バイトへ転送される。こうして
4ビツトごとに1列のずらし変換を行うので、原画像に
対してTan−1(1/4)の傾きを持った図形が画像
バッファに格納されたことになる。なお、第2図におい
て斜線で示されている、画像バッファの左下隅及び右上
隅の部分にはデータが転送されないので、画像の余白部
としてこの部分のビットは0にしておく。In the data shifting process, in the i-th transfer from the temporary buffer 109 to the image memory 103, the contents of the lower byte of the i-th byte of the temporary buffer are transferred to the lower byte of the i-th byte of the (j+1x2)th column of the image buffer 202. The content of the upper byte is the (j+ix2+1
) is transferred to the upper byte of the i-th byte of the column. In this way, since one column shift conversion is performed for every 4 bits, a figure having an inclination of Tan-1 (1/4) with respect to the original image is stored in the image buffer. Note that since no data is transferred to the lower left and upper right corners of the image buffer, which are indicated by diagonal lines in FIG. 2, the bits in these areas are set to 0 as the margins of the image.
一般的に傾きのある書体、例えばイタリック文字等はT
an −1(1/4)の傾きを原画像に与えることによ
ってもともとの字体の傾きが除去される。Generally, slanted typefaces, such as italic characters, are T.
By applying a slope of an -1 (1/4) to the original image, the original slope of the font is removed.
尚、この原画像に対して与える傾きは、Tan −1(
1/4)に限ることはなく、字体選択手段110によっ
て選択された字体によって傾きを変えるようにしても良
いし、ずらし処理を行った後の画像データをいったんC
RT7に表示し、オペレータが傾きを指示することによ
り、もう1度データのずらし処理を行って、オペレータ
が確認するようにしても良い。Note that the slope given to this original image is Tan −1(
1/4), the inclination may be changed depending on the font selected by the font selection means 110, or the image data after the shift processing may be
The data may be shifted once more by displaying it on RT7 and having the operator instruct the inclination, so that the operator can confirm it.
このように入力したデータを画像メモリに格納する前に
ずらし処理を行って傾きのある字体を補正したデータで
認識を行うことができるので、認識辞書107に傾きの
ある字体のデータを記憶させておく必要もなく、また、
文字の切り出しを行った時に隣り合うデータが入ってし
まったりということがなくなる。In this way, before storing the input data in the image memory, the data can be shifted and the slanted fonts corrected for recognition. There is no need to keep it, and
This eliminates the possibility of adjacent data being included when cutting out characters.
また、ここまででは画像データを縦に分割し列(縦方向
)ごとに画像メモリに格納し1列分のデータをテンポラ
リバッファに記憶することによってずらし処理を行う例
について述べたが、画像データを横に分割し行(横方向
)ごとに画像メモリに格納して1行分のデータをテンポ
ラリバッファに記憶することによってずらし処理を行う
ことも可能である。In addition, so far we have described an example in which shifting processing is performed by dividing image data vertically, storing each column (vertical direction) in image memory, and storing one column's worth of data in a temporary buffer. It is also possible to perform the shifting process by dividing the data horizontally, storing it in the image memory row by row (horizontal direction), and storing one row's worth of data in a temporary buffer.
[発明の効果]
本発明によれば、データのずらし処理を行うことにより
、原画像の傾きのある字体から傾きを除去することがで
きるため、以下のような効果が得られる。[Effects of the Invention] According to the present invention, by performing data shifting processing, it is possible to remove a slant from a slanted font in an original image, so that the following effects can be obtained.
(1)文字の切り出しが正確に行える。(1) Characters can be cut out accurately.
(2)傾きのある字体の文字の認識辞書は通常の傾きの
ない文字の認識辞書i流用することができる。その結果
、辞書の為のメモリ容量を小さくできる。(2) The recognition dictionary for characters with slanted fonts can be used as a recognition dictionary for characters with no slant. As a result, the memory capacity for the dictionary can be reduced.
(3)傾きが除去される為、通常の傾きのない文字用の
認識アルゴリズムをそのまま適用することが可能となる
。(3) Since the slant is removed, it is possible to apply the normal recognition algorithm for characters without a slant as is.
第1図は本発明の第1の実施例を表す構成図第2図は第
1の実施例におけるずらし処理を説明する図
第3図は通常文字とイタリック文字の何箱4図は従来の
光学的文字認識装置の構成を表す図
第1図(A)
第2図
第3図
、301Fig. 1 is a block diagram showing the first embodiment of the present invention Fig. 2 is a diagram explaining the shift processing in the first embodiment Fig. 3 is a diagram showing the number of boxes for normal characters and italic characters Figures 1 (A), 2 (A) and 3 (301) showing the configuration of a character recognition device.
Claims (2)
記画像情報を1列分ずつ格納し、 前記画像情報をずらすことが指示された場合には、前記
格納された画像情報をずらして転送するよう制御するこ
とを特徴とする文字認識方法。(1) Instructing to shift the image information in a desired manner, storing the image information one column at a time, and when shifting the image information is instructed, shifting the stored image information. A character recognition method characterized by controlling to transfer.
示手段と、 前記画像情報を1列分ずつ格納する格納手段と、前記指
示手段によって前記画像情報をずらすことが指示された
場合には、該格納手段に格納された画像情報をずらして
転送するよう制御する転送制御手段を有することを特徴
とする文字認識装置。(2) an instruction means for instructing to shift the image information in a desired manner; a storage means for storing the image information one column at a time; and when the instruction means instructs to shift the image information; , a character recognition device comprising transfer control means for controlling the image information stored in the storage means to be shifted and transferred.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2312074A JPH04182788A (en) | 1990-11-17 | 1990-11-17 | Method and device for recognizing character |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2312074A JPH04182788A (en) | 1990-11-17 | 1990-11-17 | Method and device for recognizing character |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04182788A true JPH04182788A (en) | 1992-06-30 |
Family
ID=18024921
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2312074A Pending JPH04182788A (en) | 1990-11-17 | 1990-11-17 | Method and device for recognizing character |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04182788A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8169545B2 (en) | 2007-11-15 | 2012-05-01 | Canon Kabushiki Kaisha | Display control apparatus and method for superimposing an object on a moving image |
-
1990
- 1990-11-17 JP JP2312074A patent/JPH04182788A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8169545B2 (en) | 2007-11-15 | 2012-05-01 | Canon Kabushiki Kaisha | Display control apparatus and method for superimposing an object on a moving image |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102364100B1 (en) | Table data storing system and method on the electronic document | |
| US5191612A (en) | Character recognition system | |
| EP0343786A2 (en) | Method and apparatus for reading and recording text in digital form | |
| US5974191A (en) | Image processing apparatus and method | |
| US5144682A (en) | Method and an apparatus for isolating an area corresponding to a character or word | |
| EP0457546B1 (en) | Image processing method and apparatus | |
| JPH04182788A (en) | Method and device for recognizing character | |
| JP2000105836A (en) | Logical structure extracting device | |
| JP2890306B2 (en) | Table space separation apparatus and table space separation method | |
| EP0438246A2 (en) | Method and device for outputting multicolor document | |
| CN88100809A (en) | How to generate enlarged text | |
| JPS615383A (en) | Character pattern separating device | |
| KR930007554B1 (en) | Seperating method of lower-sided vowel from consonant | |
| JPH06176142A (en) | Outline vectorizing method for automatic drawing input device | |
| JPH08123901A (en) | Character extraction device and character recognition device using this device | |
| US20080225340A1 (en) | Image processing apparatus, image processing method, and computer program product | |
| JP2812391B2 (en) | Pattern processing method | |
| KR930007553B1 (en) | Seperating method of right-sided vowel from initial consonant | |
| JPH0981672A (en) | Document reader | |
| JPH0343879A (en) | Character area separating system for character recognizing device | |
| JPS62281063A (en) | Document processor | |
| JPH03217993A (en) | Character size recognizer | |
| JPH06243285A (en) | Character recognition method | |
| JPH05324908A (en) | Compressed image recognition processing system | |
| JPH04500422A (en) | Method and apparatus for identifying unrecognizable characters in an optical character recognition device |