WO2001003068A1 - Procede et dispositif d'affichage ou de recherche d'objets dans une image, et support de stockage lisible par ordinateur - Google Patents

Procede et dispositif d'affichage ou de recherche d'objets dans une image, et support de stockage lisible par ordinateur Download PDF

Info

Publication number
WO2001003068A1
WO2001003068A1 PCT/JP2000/004400 JP0004400W WO0103068A1 WO 2001003068 A1 WO2001003068 A1 WO 2001003068A1 JP 0004400 W JP0004400 W JP 0004400W WO 0103068 A1 WO0103068 A1 WO 0103068A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
contour
displaying
values
value
Prior art date
Application number
PCT/JP2000/004400
Other languages
English (en)
French (fr)
Other versions
WO2001003068A8 (fr
Inventor
Miroslaw Z. Bober
Original Assignee
Mitsubishi Denki Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020037011345A priority Critical patent/KR100708799B1/ko
Priority to BR0006894-2A priority patent/BR0006894A/pt
Priority to JP2001508781A priority patent/JP4689119B2/ja
Priority to US09/763,852 priority patent/US6882756B1/en
Priority to KR1020037011346A priority patent/KR100708800B1/ko
Application filed by Mitsubishi Denki Kabushiki Kaisha filed Critical Mitsubishi Denki Kabushiki Kaisha
Publication of WO2001003068A1 publication Critical patent/WO2001003068A1/ja
Publication of WO2001003068A8 publication Critical patent/WO2001003068A8/ja
Priority to US11/101,637 priority patent/US7162105B2/en
Priority to US11/557,836 priority patent/US7356203B2/en
Priority to US11/929,281 priority patent/US7542626B2/en
Priority to US11/929,434 priority patent/US7492972B2/en
Priority to US11/929,471 priority patent/US7483594B2/en
Priority to US11/929,392 priority patent/US7505637B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Definitions

  • the present invention relates to a method for displaying or retrieving an object in an image, an apparatus, a program, a program, and a storage medium readable by a computer.
  • the present invention relates to the display of objects appearing in still or video images, such as images stored in a multimedia 'database, for search purposes, and in particular, to search for objects using such displays.
  • CSS curvature scale space
  • the curvature function is used to determine the outline of the object, and the display starts at an arbitrary point on the outline.
  • the curvature function is examined while developing the contour shape by performing a series of deformations to smooth the shape. More specifically, the zero-cross of the derivative of the curvature function convolved with the Gaussian philosophy is calculated. Zero crossings are plotted on the graph, as is known as curvature scale space.
  • the X-axis is the normalized arc length of the curve and the y-axis is the expansion parameter, especially the parameter of the applied file.
  • Plots on graphs are contour features Is formed. Each convex or concave part of the object's contour corresponds to a loop in the css image. c The ordinate of the peak of the most prominent loop in the SS image is used as a contour display.
  • the CSS representation of the input shape is calculated to search for an object in the stored image that is consistent with the shape of the input object during the overnight database.
  • the similarity between the input shape and the stored shape is determined.
  • a problem with known CSS representations is that the beak of a given contour is based on a calculated curvature function starting from any point on the contour. If this start point is changed, a periodic shift occurs along the X-axis of the peak of the CSS image. Therefore, when calculating similarity measures, all possible shifts or at least the most likely shifts need to be considered. This increases the complexity of the search and matching procedures.
  • the present invention provides a method for representing an object appearing in a still or video image by processing a signal corresponding to the image, the method comprising: starting at any point on the contour;
  • the method includes a step of deriving a plurality of numerical values related to a feature appearing on the contour, and a step of applying a predetermined sorting to the values to obtain a contour display.
  • the value is derived from a CSS display of the contour, and the value preferably corresponds to a CSS beak value.
  • a method for displaying an object in an image according to claim 1 of the present invention is a method for representing an object appearing in an image by processing a signal corresponding to a still image or a video image, comprising: Starting from an arbitrary point on the contour, a step of deriving a plurality of numerical values related to features appearing on the contour, and a step of applying predetermined sorting to the values to obtain a display of the contour.
  • predetermined sorting is performed so that the resulting display does not depend on the starting point on the contour.
  • the numerical value reflects a bending point on a curve.
  • a method for displaying an object in an image comprising the steps of smoothing an outline in a plurality of stages using a smoothing parameter overnight sigma, thereby generating a plurality of contour curves.
  • a curve representing the characteristic of the original contour using the values representing the maximum and minimum values of the curvature of each contour curve, it is possible to further select the ordinate of the peak of the characteristic curve as a numerical value. Gives an indication of the curvature scale space of the contour.
  • the method for displaying an object in an image according to claim 5 according to the present invention is characterized in that the ordinate of the characteristic curve corresponds to the arc length parameter and the smoothing parameter of the contour.
  • the ordinate value of the beak is sorted based on the value of the peak height corresponding to the smoothing parameter.
  • the values are sorted from the maximum value.
  • the values are sorted in descending order of magnitude.
  • the values are sorted from the minimum value.
  • a method for displaying an object in an image according to claim 10 of the present invention is a method for representing an object appearing in an image by processing a signal corresponding to a still image or a video image, comprising: Deriving a plurality of numerical values associated with features appearing on the contour to represent the contour of the contour, and deriving a coefficient indicating a display reliability using a relationship between at least two of the values. And A method for displaying an object in an image according to claim 11 according to the present invention, wherein the coefficient is based on a ratio between two of the values.
  • the ratio is a ratio between two maximum values.
  • a method for displaying an object in an image according to claim 13 according to the present invention is characterized in that a contour is smoothed in a plurality of stages using a smoothing parameter overnight sigma, and as a result, a plurality of contour curves are generated. Also, by using the values representing the maximum and minimum values of the curvature of each contour curve to derive the curves showing the characteristics of the original contour, the ordinate of the peak of the curve showing the characteristic is selected as a numerical value. By doing so, a curvature scale space representation of the contour is obtained.
  • a method for displaying an object in an image according to claim 14 of the present invention derives a value by using the method according to any one of claims 1 to 9.
  • a method for searching for an object in an image according to claim 15 of the present invention is a method for searching for an object in an image by processing a signal corresponding to a still image or a video image, A step of inputting the query in the form of a two-dimensional contour, a step of deriving a contour descriptor using the method according to any one of claims 1 to 9, and a step of deriving a descriptor of the contour using the method according to any one of claims 1 to 9.
  • a method for retrieving an object in an image according to claim 16 of the present invention uses the method according to any one of claims 10 to 12 for a contour of a query, and Coefficients are derived for each stored contour and the comparison is made using only the predetermined sorting or using some other sorting depending on the predetermined sorting and coefficients.
  • a method for displaying an object in an image according to claim 17 of the present invention is a method for representing a plurality of objects appearing in an image by processing a signal corresponding to a still image or a video image.
  • Features that appear on the outline of each object Deriving a plurality of values associated with the signature; and applying the same predetermined sorting to the values representing each contour to obtain a representation of each contour.
  • An apparatus for displaying or searching for an object in an image according to claim 18 of the present invention is adapted to perform the method according to any one of claims 1 to 17.
  • a program for displaying or searching for an object in an image according to claim 19 of the present invention is adapted to execute the method according to any one of claims 1 to 17. Is done.
  • a computer for displaying or searching for an object in an image according to claim 20 of the present invention is programmed to operate in accordance with the method of any one of claims 1 to 17. ing.
  • a readable storage medium according to claim 21 of the present invention stores a process executable by a convenience for realizing the method according to any one of claims 1 to 17.
  • a method for displaying an object in an image according to claim 22 of the present invention is substantially the same as that described in the present specification with reference to the accompanying drawings, in a still image or a video image. Object.
  • a method for searching for an object in an image according to claim 23 of the present invention is substantially the same as that described in the present specification with reference to the accompanying drawings. Search for objects in.
  • a combination display system for displaying or searching for an object in an image according to claim 24 of the present invention is substantially the same as that described in the present specification with reference to the accompanying drawings.
  • Figure 1 shows a block diagram of the video database system.
  • Figure 2 shows the outline of the object
  • FIG. 3 is a diagram of the CSS display showing the outline of FIG. 2,
  • FIG. 4 is a block diagram illustrating a search method. BEST MODE FOR CARRYING OUT THE INVENTION
  • FIG. 1 is a diagram illustrating a video database system in which a process is performed according to an embodiment of the present invention.
  • the system includes a control device 2 in the form of a combination, a display device 4 in the form of a monitor 4, a pointing device 6 in the form of a mouse, an image database 8 containing stored still and video images, and an image database. It contains a descriptor database 10 which stores descriptors of objects or some parts of objects that appear in the images stored in evening 8.
  • a descriptor representing the shape of each object of interest appearing in the images of the image database is derived by the controller 2 and stored in the descriptor database 10.
  • the controller 2 operates and derives descriptors under the control of an appropriate program that performs a method as described below.
  • a CSS representation of this contour is derived.
  • This CSS display is performed using a well-known method as described in one of the above-mentioned articles.
  • This contour is smoothed by convolving with an ID Gaussian kernel g di '/ O), and the zero curvature cross of the evolving curve is examined as a change in.
  • the zero cross is specified using the following equation representing the curvature. ⁇ ⁇ .
  • the number of zero-curvature crosses changes as ⁇ changes, and when ⁇ is high enough, it becomes a convex-cross-curve.
  • Zero-cross points are plotted on a graph known as the CSS image space. This results in a curve that is characteristic of the original contour. A curve beak exhibiting this feature is identified, and the corresponding ordinate is extracted and stored.
  • a set of ⁇ coordinate pairs ((xl, y1), (x2, y2), ... (xn, yn) (where n is the number of beaks, Xi is position of the arc length of the ith beak, yi is the height of the beak)
  • the sort and position of the curve exhibiting this feature, and the corresponding beak, when appearing in CSS image space, depend on the starting point of the curvature function described above.
  • the ordinates of the beaks are re-sorted using a dedicated sorting function.
  • the sorting is performed by the one-to-one mapping ⁇ of the beak index ⁇ l ... n ⁇ to the new set index ⁇ .,. ⁇ .
  • Each value X i follows a periodic shift of 1 x k.
  • the ordinates of these re-sorted peaks form the basis for descriptors of the object's contour, stored in database 10.
  • the ordinates of the beaks are stored in the sort order shown in Table 2.
  • the ordinate may be stored with an associated index indicating the new sort order. Example 2.
  • the largest beak is selected and placed first, and then the remaining beaks follow in the original sequence starting from the largest beak.
  • C F is calculated from the ratio of the second maximum beak value to the maximum beak value for a given shape.
  • the CF value in this example reflects the accuracy of the display, that is, the uniqueness.
  • a CF value close to 1 means low reliability
  • a CF value close to zero means high reliability.
  • CF values can be useful when performing a matching procedure as described in the following description. Example 3.
  • FIG. 4 is a block diagram showing a search method.
  • descriptors derived according to the first sorting method described above are stored in the descriptor database 10 of the system of FIG. 1 together with the associated CF values.
  • the user initiates the search by using the pointing device to outline the object on the display (step 410).
  • the controller 2 derives a CSS representation of the input contour, sorts the ordinates of the beaks according to the same sort function used for the images in the database, and obtains a descriptor representing the input contour (Step 420).
  • the control device 2 also calculates the CF value of the input contour by calculating the ratio of the second maximum peak value to the maximum peak value, and quantizes the result (step 430).
  • the control device 2 compares the CF value of the input contour with a predetermined threshold value (step 440).
  • the threshold is 0.75. If the CF value is below this threshold, indicating a relatively high degree of confidence in the accuracy of the input descriptor, the next step is to consider the model under consideration (i.e. the image stored on a data base). This is the step to consider the CF value. If the CF of the model is still lower than the threshold (step 450), the input descriptor is compared with the model using only the respective descriptors in the predetermined sort order (step 450). . If the CF of either the input descriptor or the model is greater than the threshold, matching is performed by comparing all possible different sort orders of the ordinate values in the input descriptor with the model descriptor in the database. (Step 4 7 0) o
  • Matching comparisons are made using an appropriate algorithm that results in a similarity measure for each descriptor in the database.
  • a well-known matching algorithm as described in the above-mentioned paper may be used. Briefly about this matching procedure explain.
  • the similarity measure is defined as the total cost of matching the beak in the image with the beak in the model.
  • the matching that minimizes the total cost is calculated using dynamic 'programming.
  • the algorithm recursively matches the beaks obtained from the model to the peaks obtained from the image and performs a cost calculation for each such match.
  • Each model beak can be matched with only one image beak, and each image peak can be matched with only one model beak. Some models and / or image peaks may remain unmatched, and there is an additional penalty 'cost for each unmatched beak.
  • Two beaks can be matched if their horizontal distance is less than 0.2. The cost of a match is the length of the straight line between the two matched beaks. The cost of a match that did not match is its high cost.
  • the algorithm works by creating and extending a tree-like structure where the nodes correspond to the matched peaks.
  • Unmatched image peaks or models ⁇ Define the match's cost as the highest height of the peak and remove the peak from the list.
  • the matching process ends.
  • the cost of this node is a similarity measure between the image and the model curve. If there is a peak, Return to Int 7 to expand the node with the lowest cost.
  • the above procedure is repeated, exchanging the image curve beak value and the model curve peak value.
  • the final matching value is the lower of these two beak values.
  • the distance between the input X value and the corresponding model X value and the distance between the input y value and the corresponding model y value is calculated.
  • the total distance for all positions is calculated, the smaller the total distance, the closer the match. If the input contour and the model have different numbers of beaks, the total distance includes the height of the remaining unmatched beaks.
  • step 480 The above steps are repeated for each model on a data basis.
  • the similarity values resulting from the matching comparison are sorted (step 490), and then the object corresponding to the descriptor having the similarity value indicating the closest matching value (ie, the lowest similarity value in this example) is determined.
  • the information is displayed on the display device 4 to the user (step 500).
  • the number of objects to be displayed can be preset or selected by the user.
  • the threshold is set to 0.75, but this threshold can be set to a different level. For example, if the threshold is set to zero, all matching is done by analysis of some or all possible orders. This requires more computation than when the threshold is greater than or equal to zero, but the beak values are already sorted and the X coordinate of the beak value is adjusted for a specific starting point or object rotation The amount of computation required is reduced compared to the original system without such adjustments. Therefore, by setting the threshold to zero, the system will have a slight reduction in computational cost, and the search performance will be exactly the same as in the original system. Alternatively, if the threshold is set to 1, matching is performed using only the stored order. In that case, the required computational complexity can be significantly reduced with only a slight decrease in search accuracy.
  • the system according to the invention can be provided, for example, in an image library.
  • the database can be connected to the controller by a temporary link, such as a telephone line, over a network such as the Internet, and can be located remotely from the system controller.
  • the image database and the descriptor database can be provided in permanent storage or in a portable storage medium such as ROM or DVD.
  • the components of the system as described above can be provided in the form of software or hardware.
  • the present invention has been described in the form of a computer system, the present invention can be implemented in other forms using a dedicated chip or the like.
  • specific examples have been given that show how to represent a 2D shape of an object and how to calculate a value that represents the similarity between two shapes, any similar suitable method can be used.
  • the present invention can be used to match object images for verification purposes or to perform filtering.

Description

明 細 書 画像中のオブジェクトを表示するまたは検索する方法、 その装置、 コンビユー夕 -プログラム、 コンビユー夕 ·システム、 及びコンビュ一夕可読記憶媒体 技術分野
本発明は、 検索を目的とする、 マルチメディア 'データベースに保存された画 像のような静止画像またはビデオ画像中に現れるオブジェク卜の表示に関し、 特 に、 そのような表示を用いてオブジェクトを検索する方法及び装置に関する。 冃景技術
ビデオ ·ライブラリの画像のようなアプリケーションでは、 ビデオ画像あるい は静止画像中に現れるオブジェク卜の輪郭や形状またはオブジェク卜の一部の効 率的な表示および保存を行うことが望ましい。 形状ベースの索引付けと検索を行 うための公知の手法では曲率スケール空間(C S S)表示が用いられる。 C S Sの 詳細については、 論文 「曲率スケール空間によるロバストで効率的な形状索引付 け」 (英国マシーン · ビジョン会報 pp. 5 3〜 6 2、 ェジンバラ、 英国、 1 9 9 6年)ならびに 「曲率スケール空間を用いる形状内容による画像デ一夕ベースの 索引付け」 (ィンテリジェント ·データベースに関する I E E専門家会議会報、 ロンドン、 1 9 9 6年)の中で入手することができる。 両論文とも Mokhtarian 、 S.Abbasiならびに J.Kittlerによるものであり、 その内容は本明細書中に参考 文献として取り入れられている。
C S S表示では、 オブジェクトの輪郭を求めるために曲率関数が使用され、 輪 郭上の任意の点から表示が開始される。 形状を平滑化する一連の変形を行うこと により輪郭の形状を展開しながら、 曲率関数が検討される。 さらに具体的には、 ガウスフィル夕の族と共に畳み込まれた曲率関数の導関数のゼロ · クロスが計算 される。 曲率スケール空間として周知のように、 ゼロ ·クロスはグラフ上にプロ ットされる。 但し、 X軸は曲線の正規化された弧長であり、 y軸は展開パラメ一 夕、 特に、 適用フィル夕のパラメ一夕である。 グラフ上のプロットは輪郭の特徴 を示すループを形成する。 オブジェク 卜の輪郭の各凸状または凹状を成す部分は c s s画像におけるループに対応する。 c S S画像において最も突起したループ のピークの縦座標は輪郭の表示として利用される。
入カオブジェク 卜の形状に一致する、 デ一夕ベース中の保存画像のオブジェク トを検索するために、 入力形状の c S S表示が計算される。 マッチング 'ァルゴ リズムを用いて、 それそれの C S S画像のピークの位置および高さを比較するこ とにより、 入力形状と保存形状との間の類似度が判定される。
公知の C S S表示に関する問題点として、 所定の輪郭のビークが輪郭上の任意 の点から開始され計算される曲率関数に基づくということが挙げられる。 この開 始点が変更されると C S S画像のピークの X軸に沿って周期的シフ卜が生じる。 したがって、 類似度測定値を計算するとき、 すべての可能なシフトあるいは少な くとも最も生じ得るシフトについて検討する必要がある。 この結果、 検索手順お よびマッチング手順の複雑さが増すということになる。
したがって本発明は、 画像に対応する信号を処理することにより静止画像また はビデオ画像中に現れるオブジェクトを表す方法を提供するものであり、 該方法 は、 輪郭上の任意の点から始まり、 オブジェクトの輪郭上に現れている特徴と関 連する複数の数値を導き出すステップと、 前記値に対して所定のソーティングを 適用して輪郭の表示を得るステップとを有する。 好適には、 前記輪郭の C S S表 示から前記値を導き出すことが望ましく、 また、 前記値が C S Sビーク値に対応 することが望ましい。
本発明の結果として、 検索精度の著しい低下を伴うことなくマツチング手順に 関わる計算を大幅に低減することが可能となる。 発明の開示
この発明に係る請求項 1に記載の画像中のオブジェクトを表示する方法は、 静 止画像またはビデオ画像に対応する信号を処理することにより、 画像中に現れる オブジェクトを表す方法であって、 オブジェク 卜の輪郭上の任意の点から始めて 、 輪郭上に現れる特徴と関連する複数の数値を導き出すステップと、 値に対して 所定のソーティングを適用して輪郭の表示を得るステップとを有する。 この発明に係る請求項 2に記載の画像中のオブジェクトを表示する方法は、 結 果として得られた表示が輪郭上の開始点に依存しないように所定のソーティング がなされる。
この発明に係る請求項 3に記載の画像中のオブジェクトを表示する方法は、 数 値が曲線上の屈曲点を反映する。
この発明に係る請求項 4に記載の画像中のオブジェクトを表示する方法は、 平 滑化パラメ一夕シグマを用いて複数の段階で輪郭を平滑化し、 その結果複数の輪 郭曲線を生じることにより、 また、 各輪郭曲線の曲率の最大値と最小値を表す値 を用いて元の輪郭の特徴を示す曲線を導き出すことにより、 さらに、 数値として 特徴を示す曲線のピークの縦座標を選択することにより、 輪郭の曲率スケール空 間の表示を得る。
この発明に係る請求項 5に記載の画像中のオブジェクトを表示する方法は、 特 徴を示す曲線の縦座標が輪郭の弧長パラメータと平滑化パラメータとに対応する この発明に係る請求項 6に記載の画像中のオブジェク 卜を表示する方法は、 平 滑化パラメ一夕に対応するピークの高さの値に基づいてビークの縦座標値がソ一 卜される。
この発明に係る請求項 7に記載の画像中のオブジェクトを表示する方法は、 値 が最大値からソートされる。
この発明に係る請求項 8に記載の画像中のオブジェクトを表示する方法は、 値 が大きさの降順にソートされる。
この発明に係る請求項 9に記載の画像中のオブジェクトを表示する方法は、 値 が最小値からソートされる。
この発明に係る請求項 1 0に記載の画像中のオブジェクトを表示する方法は、 静止画像またはビデオ画像に対応する信号を処理することにより、 画像中に現れ るオブジェクトを表す方法であって、 オブジェクトの輪郭を表すために、 輪郭上 に現れる特徴と関連する複数の数値を導き出すステップと、 値のうちの少なくと も 2つ値の間の関係を用いて表示の信頼性を示す係数を導き出すステツプとを有 する。 この発明に係る請求項 1 1に記載の画像中のオブジェクトを表示する方法は、 係数が値のうちの 2つの値の間の比に基づく。
この発明に係る請求項 1 2に記載の画像中のオブジェクトを表示する方法は、 比が 2つの最大値の比である。
この発明に係る請求項 1 3に記載の画像中のオブジェク卜を表示する方法は、 平滑化パラメ一夕シグマを用いて複数の段階で輪郭を平滑化し、 その結果複数の 輪郭曲線を生じることにより、 また、 元の輪郭の特徴を示す曲線を導き出すため の各輪郭曲線の曲率の最大値と最小値を表す値を用いることにより、 さらに、 数 値として特徴を示す曲線のピークの縦座標を選択することにより、 輪郭の曲率ス ケール空間表示が得られる。
この発明に係る請求項 1 4に記載の画像中のオブジェクトを表示する方法は、 請求項 1乃至 9のいずれか 1つに記載の方法を用いて値を導き出す。
この発明に係る請求項 1 5に記載の画像中のオブジェクトを検索する方法は、 静止画像またはビデオ画像に対応する信号を処理することにより、 画像中のォブ ジェクトを検索する方法であって、 2次元の輪郭の形でクエリ一を入力するステ ップと、 請求項 1乃至 9のいずれか 1つに記載の方法を用いて輪郭の記述子を導 き出すステップと、 請求項 1乃至 9のいずれか 1つに記載の方法を用いて導き出 された、 保存された画像中のオブジェクトの記述子を取得し、 保存されたォブジ ェク卜の各記述子とクエリー記述子を比較するステップと、 比較によってクエリ —とオブジェクトの間の類似度の程度が示される対象オブジェクトを含む画像に 対応する少なくとも 1つの結果を選択し表示するステップとを有する。
この発明に係る請求項 1 6に記載の画像中のオブジェクトを検索する方法は、 請求項 1 0乃至 1 2のいずれか 1つに記載の方法を用いて、 クエリーの輪郭につ いて、 および、 各保存された輪郭について係数が導き出され、 所定のソ一ティン グのみを用いて、 または、 所定のソーティングと係数に依存する何らかの他のソ —ティングを用いて比較を行う。
この発明に係る請求項 1 7に記載の画像中のオブジェクトを表示する方法は、 静止画像またはビデオ画像に対応する信号を処理することにより、 画像中に現れ る複数のオブジェク卜を表す方法であって、 各ォブジェク 卜の輪郭上に現れる特 徴と関連する複数の数値を導き出すステップと、 各輪郭を表す値に同じ所定のソ —ティングを適用して各輪郭の表示を得るステップとを有する。
この発明に係る請求項 1 8に記載の画像中のオブジェクトを表示するまたは検 索する装置は、 請求項 1乃至 1 7のいずれか 1つに記載の方法を実行するように 適合される。
この発明に係る請求項 1 9に記載の画像中のオブジェクトを表示するまたは検 索するコンビュ一夕 ·プログラムは、 請求項 1乃至 1 7のいずれか 1つに記載の 方法を実行するように適合される。
この発明に係る請求項 2 0に記載の画像中のオブジェクトを表示するまたは検 索するコンピュータ .システムは、 請求項 1乃至 1 7のいずれか 1つに記載の方 法に従って作動するようにプログラムされている。
この発明に係る請求項 2 1に記載のコンビユー夕可読記憶媒体は、 請求項 1乃 至 1 7のいずれか 1つに記載の方法を実現するためのコンビユー夕で実行可能な 処理を保存する。
この発明に係る請求項 2 2に記載の画像中のオブジェクトを表示する方法は、 添付図面を参照して本明細書で説明したものと実質的に同じように、 静止画像ま たはビデオ画像中のオブジェクトを表す。
この発明に係る請求項 2 3に記載の画像中のォブジェクトを検索する方法は、 添付図面を参照して本明細書で説明したものと実質的に同じように、 静止画像ま たはビデオ画像中のオブジェクトを検索する。
この発明に係る請求項 2 4に記載の画像中のォブジヱクトを表示するまたは検 索するコンビユー夕 .システムは、 添付図面を参照して本明細書で説明したもの と実質的に同じである。 図面の簡単な説明
図 1は、 ビデオ ·データベース ·システムのプロック図、
図 2は、 オブジェクトの輪郭の図、
図 3は、 図 2の輪郭を示す C S S表示の図、
図 4は、 検索方法を例示するブロック図である。 発明を実施するための最良の形態
添付図面を参照しながら本発明の実施例について説明する。
実施例 1 .
図 1は、 本発明の実施例によるコンビュ一夕処理が行われるビデオ ·データべ ース 'システムを図示する。 このシステムには、 コンビユー夕の形の制御装置 2 、 モニタ一の形の表示装置 4、 マウスの形のポインティング 'デバイス 6、 保存 された静止画像とビデオ画像とを含む画像データベース 8および画像デ一夕べ一 ス 8に保存された画像中に現れるオブジェク卜またはオブジェク卜のいくつかの 部分の記述子を保存する記述子データベース 1 0が含まれる。
画像データベースの画像中に現れる興味のある各ォブジェクトの形状を表す記 述子は、 制御装置 2によって導き出され、 記述子データベース 1 0に保存される 。 制御装置 2は、 以下に説明するような方法を実行する適切なプログラムの制御 によって動作して記述子を導き出す。
第一に、 所定のオブジェクトの輪郭について、 この輪郭の C S S表示が導き出 される。 上述の論文の 1つに記載されているような周知の方法を用いてこの C S S表示が行われる。
さらに具体的には、 この輪郭は写像表現 Ψ = {(χ(υ),γ(χι),υ ε [0,1]}によって表さ れる(ただし、 uは正規化された弧長パラメ一夕である)。
この輪郭は、 I Dガウスカーネル g di ' /O )を用いて畳み込みを行う(convolve) ことにより平滑化され、 の変化として展開 (evolving)曲線の曲率ゼロ · クロス が調べられる。 ゼロクロスは曲率を表す下記の式を用いて特定される。 ιι .
但し、
X(U) σ) = x(u) * g(u, σ) Y(u, σ) =y( ) * g(u, σ) かつ、 Xu (", σ) = x(u) * gu (u,び) Xuu (u, σ) = x( ) * gm ( , σ) 上記で、 *は畳み込みを表し、 添え字は導関数を表す。
曲率ゼロ 'クロスの数は ρの変化につれて変化し、 ρが十分に高いとき はゼ 口 ·クロスの凸状の曲線となる。
ゼロクロス ·ポイント(u, ρ)は C S S画像空間として知られるグラフ上にプ ロットされる。 この結果元の輪郭の特徴を示す曲線が生じる。 この特徴を示す曲 線のビークが特定され、 対応する縦座標が抽出され保存される。 一般に上記の結 果、 η個の座標の対 ((x l , y 1 )、 (x 2 , y 2 )、 ...(xn, yn)の組 (ただし、 nはビーク の数、 X iは i番目のビークの弧長の位置、 yi はビークの高さである)が与えら れる
この特徴を示す曲線のソートおよび位置ならびに対応するビークは、 C S S画 像空間に現れるとき、 上述の曲率関数の開始点に依存する。 本発明ではビークの 縦座標は専用のソート関数を用いて再ソートされる。
ソーティングは、 新しい集合のインデックス {ΐ.,.ημこ対するビーク ·インデヅ クス {l...n}の 1対 1写像 Τによって行われる。
本実施例では、 縦座標の対は y縦座標のサイズを考慮することによりソートさ れる。 第 1に最大ビークが選択される。 k番目のビークが最も突起していると仮 定する。 その場合、 値のソートされた集合の中で (xk, yk)が第 1番目の座標にな る。 言い換えれば T (k)= 1である。 同様に、 その他のビークの縦座標はビーク の高さの降順に再ソートされる。 2つのピークが同じ高さを持っている場合、 上 記縦座標の対の X座標に最も近い X座標を持っているピークが第 1に配置される 。 言い換えれば、 元のインデックス iを持っている各縦座標の対が新しいインデ ックス jに割り当てられる。 但し、 T(i)=jかつ yj> = y(j+ l)である。 また、 各値 X iは一 x kの周期的シフ卜に従う。
特定の例として、 図 2に図示の輪郭から図 3に図示のような C S S画像の結果 が得られる。 C S S画像の曲線のビークの縦座標の詳細を以下の表 1に示す。 X Y
ビークインデックス
1 0.124 123
2 0.68 548
3 0.22 2120
4 0.773 1001
5 0.901 678
表 1 これらのビークは上述のソーティングを用いてソートされる。 すなわち、 縦座 標はビークの高さの降順にソートされる。 また、 X縦座標はすべて最大ピークの 元の X縦座標に等しい量だけゼロの方へシフ卜される。 この結果以下の表 2に示 されるような再ソートされたピーク座標が生じる。
表 2
これらの再ソートされたピークの縦座標によって、 データベース 1 0に保存さ れる、 オブジェクトの輪郭についての記述子のベースが形成される。 本実施例で は、 表 2に示すソ一卜順にビークの縱座標が保存される。 或いは新しいソ一卜順 を示す関連するインデックスと共に縦座標を保存してもよい。 実施例 2 .
第 2の実施例に従うオブジェク卜の輪郭を表す代替方法について説明する。 輪郭を示す C S S表示は上述のように導き出される。 しかし、 ピークの縦座標 のソートは上述の実施例 1のソートとは異なる。 さらに具体的には、 第 1に最大 ビークが選択される。 ピーク kを最も突起したビークと仮定する。 その場合、 (xk, yk)がビークのソートされた集合の中で第 1のピークになる。 次に続くビー クは、 元のインデックス iのピークの縦座標について、 T(i)=jかつ xjく =x(j + l) となるようにソートされる。 また、 元のピーク kの元の X縦座標に等しい量 x k だけ下方へすべての値 X iがシフ卜される。
換言すれば、 実施例 2に従うソート方法では、 最大ビークが選択され、 第 1に 配置され、 次いで、 残りのビークが最大ビークから始まる元のシーケンスで続く 以下の表 3は第 2の実施例に従ってソートされた表 1のビーク値を示す表であ る,
表 3
上述の実施例 1と 2の展開では信頼係数 (C F)が形状の各表示と関連付けられ る。 C Fは、 所定の形状の第 2の最大ビーク値と最大ビーク値との比から計算さ れ .
図 2に図示の輪郭については、 C F値は C F = 1 0 0 1 / 2 1 2 0である。 こ の例では、 C Fは最も近い 0. 1に丸めることにより量子化されて記憶要件が少 なくなる。 したがって、 本例では C F = 0. 5である。
本例の C F値は表示の精確さすなわち一意性の反映である。 本例では、 1に近 い C F値は低い信頼性を意味し、 ゼロに近い C F値は高い信頼性を意味する。 言 い換えれば 2つの最大ピーク値が近ければ近いほど表示は正確なものとなる可能 性が少なくなる。 以下の説明に示されるようなマツチング手順を行うとき、 C F値は有益なもの となり得る。 実施例 3 .
本発明の一実施例に準拠する、 画像中のオブジェクトを検索する方法について 、 検索方法を示すプロック図である図 4を参照しながら説明する。
本例では、 図 1のシステムの記述子データベース 1 0中には、 関連づけられた C F値とともに、 上述した第 1のソート方法に従って導き出された記述子が保存 されている。
ユーザーは、 ポインティング 'デバイスを用いて、 ディスプレイ上にオブジェ クトの輪郭を描くことにより検索を開始する(ステップ 4 1 0 )。 次いで、 制御装 置 2が入力輪郭の C S S表示を導き出し、 データベース中の画像に対して使用す る関数と同じソート関数に従ってビークの縦座標のソートが行われ、 入力輪郭を 表す記述子が得られる(ステップ 4 2 0 )。 次いで、 制御装置 2は、 最大ピーク値 に対する第 2の最大ピーク値の比率を計算することにより入力輪郭の C F値も計 算し、 その結果の量子化を行う(ステップ 4 3 0 )。
次いで、 制御装置 2は入力輪郭の C F値を所定の閾値と比較する(ステツプ 4 4 0 )。 本例ではその閾値は 0 . 7 5である。 入力記述子の精度に対して相対的に 高い信頼性を示して、 C F値がこの閾値より低い場合には、 次のステップは考慮 中のモデル (すなわちデ一夕ベースに保存された画像)の C F値について考慮する ステップである。 モデルの C Fがやはり閾値より低い場合 (ステップ 4 5 0 )、 所 定のソ一卜順のそれそれの記述子のみを用いて入力記述子とモデルとの比較が行 われる(ステップ 4 6 0 )。 入力記述子またはモデルのいずれかの C Fが閾値より 大きい場合、 入力記述子中の縦座標値のすべての可能な異なるソート順をデ一夕 ベース中のモデル記述子と比較することによりマッチングが行われる(ステップ 4 7 0 )o
データベース中に各記述子の類似度測定値が結果として得られる適切なァルゴ リズムを用いてマツチング比較が行われる。 上述の論文で説明したような公知の マッチング ·アルゴリズムを用いてもよい。 このマッチング手順について簡単に 説明する。
2つの閉鎖した輪郭の形状、 画像曲線 i とモデル曲線 Ψπιおよびそれらの曲 線のビークのそれそれの設定値 {(xil, yil),(xi2, yi2),..,(xin, yin)}と {(xml, yml), (xm2, ym2),..,(xmn, yirm)}が与えられれば、 類似度測定値は計算される。 類似度 測定値は、 画像中のビークとモデル中のビークのマッチングの総コストとして定 義される。 総コストを最少化するマッチングはダイナミック 'プログラミングを 用いて計算される。 アルゴリズムによって、 モデルから得たビークが画像から得 たピークに再帰的にマッチされ、 このようなマッチの各々のコスト計算が行われ る。 各モデルのビークを唯一の画像ビークとマッチさせることができ、 各画像ピ —クを唯一のモデル · ビークとマッチさせることができる。 モデルおよび/また は画像ピークのなかにはマッチしないままのものがある場合もあり、 各マッチし ないビークについては追加のペナルティ 'コストが存在する。 2つのビークの水 平距離が 0 . 2未満の場合、 2つのビークをマッチすることができる。 マッチの コストは 2つのマッチしたビーク間の直線の長さである。 マッチしなかったビ一 クのコストはその高さである。
更に詳述すれば、 アルゴリズムは、 ノードがマッチしたピークに対応するヅリ —状の構造を作成し拡張することにより機能する。
1 .画像 (xik, yik)の最大値とモデル (xir, yir)の最大値とから成る開始ノードを 作成する。
2 . 画像ビークの最大値の 8 0 %以内の各残りのモデル · ビークについて追加 の開始ノードを作成する。
3 . 1および 2で作成した各開始ノードのコストを、 この開始ノードとリンク した画像ビークおよびモデル · ピークの y座標の差の絶対値に初期化する。
4 . 3の各開始ノードについて、 この開始ノードでマッチしたモデル ' ビーク と画像ビークの x (水平)座標の差として定義する C S Sシフト ·パラメ一夕アル ファを計算する。 シフト 'パラメ一夕は各ノードについて異なるものとなる。
5 . 各開始ノードについて、 モデル ' ビークのリストおよび画像ピークのリス トを作成する。 このリス卜にはどのピークがまだマッチしていないかに関する情 報が含まれる。 各開始ノードについて、 "マッチしたもの" としてこのノードで マッチしたピークにマークをつけ、 他のすべてのピークには "マッチしなかった もの" としてマークをつける。
6 . ポイント 8の条件が満たされるまで、 最低コストのノードを再帰的に拡大 する(ステップ 1〜 6でを作成した各ノードから始めて、 各ノードの子ノードが 後に続く)。 ノードを拡大するために以下の手順を用いる。
7 . ノードの拡大:
マッチしないままになっている少なくとも 1つの画像と 1つのモデル · ピーク が存在する場合、
マッチしない最も大きなスケール画像曲線 C S Sの最大値 (xip, yip)を選択す る。 (ステップ 4で計算した)開始ノード ' シフ ト 'パラメ一夕を適用して選択し た最大値をモデル C S S画像に写像し、 選択されたピークは座標 (xip-alpha, yip)を持つことになる。 マッチしない最も近いモデル曲線ピーク (xms, yms)を決 定する。 2つのビーク間の水平距離が 0 . 2未満 (すなわち | xip-alpha-xms | < 0 . 2 )である場合、 2つのピークをマッチさせ、 2つのビーク間の直線の長さとし てマッチのコストを定義する。 そのノードの総コス卜にマッチのコストを加える 。 マッチしたビークに "マヅチした" ものとしてマークをつけることによりそれ それのリス卜からマッチしたピークを取り除く。 2つのピーク間の水平距離が 0 . 2より大きい場合、 画像ピーク (xip, yip)はマッチすることはできない。 その場 合総コストに画像ビークの高さ yipを加え、 "マッチした" ものそのピークにマ ークとつけることにより画像ビーク · リストからピーク (xip, yip)だけを取り除 上記条件が当てはまらなレ、 (マッチしなかった画像ビークしか存在しない、 ま たはマッチしなかったモデル ' ピークしか存在しない)場合、 マッチしないまま の状態に放置する。
マッチしなかった画像ピークまたはモデル · ピークの最も高い高さとしてマツ チのコストを定義しリス卜からピークを取り除く。
8 . 7でノードを拡大した後、 画像リストおよびモデル · リストの双方にマツ チしないビークが存在しない場合マッチング処理は終了する。 このノードのコス トは画像とモデル曲線間の類似度測定値である。 ピークが存在する場合には、 ポ イン 卜 7へ戻り最低コス 卜のノードを拡大する。
画像曲線ビーク値とモデル曲線ピーク値とを交換して上記手順を繰り返す。 最 終マッチング値はこれら 2つのビーク値のうちの低い方の値である。
もう 1つの例として、 ソートされた順序の各位置について、 入力された X値と それに対応するモデルの X値との間の距離および入力された y値とそれに対応す るモデルの y値との間の距離が計算される。 すべての位置についての合計距離が 計算され、 合計距離が小さければ小さいほどマッチの程度は近くなる。 入力輪郭 とモデルのビークの数が異なる場合、 合計距離の中に残りのマッチしなかったビ ークの高さが含まれる。
上記ステップがデ一夕ベースの各モデルについて繰り返される(ステップ 4 8 0 )。
マッチング比較の結果生じる類似度値がソートされ (ステップ 4 9 0 )、 次いで 、 最も近いマッチング値 (すなわち本例では最も低い類似度値)を示す類似度値を 持つ記述子に対応するォブジェク卜がユーザーに対して表示装置 4に表示される (ステップ 5 0 0 )。 表示対象のオブジェクト数はユーザーが予め設定するか選択 することができる。
上記実施例では、 C F値の方が閾値より大きい場合、 マッチング時に入力記述 子値のすべての可能な順序が考慮される。 しかしながら、 すべての可能な順序を 考慮する必要はなく、 代わりに、 元の C S S表示のいくつかのまたはすベての周 期的シフ トのようないくつかの可能な順序だけを考慮することができる。 さらに
、 上記実施例では、 閾値は 0 . 7 5に設定されるが、 この閾値は異なるレベルに 設定することもできる。 例えば、 閾値がゼロに設定された場合、 いくつかのまた はすべての可能な順序の分析によってすベてのマツチイングが行われる。 このた め、 閾値がゼロ以上の場合と比較して必要な計算量が増えることになるがビーク 値が既にソートされていて、 ビーク値の X座標が、 特定の開始点またはオブジェ クト回転について調整されているので、 そのような調整が行われていない元のシ ステムと比較すると必要な計算量は低減する。 したがってゼロに閾値を設定する ことによりシステムは計算コストの若干の減少を行い、 検索パフォーマンスは元 のシステムの場合とまったく同じになる。 或いは、 閾値が 1に設定された場合、 保存された順序だけを用いてマッチング が行われる。 その場合、 検索精度にはほんのわずかの低下しか伴わずに必要な計 算量を著しく減らすことができる。
上述の実施例に対して様々な変更が可能である。 例えば、 実施例 1および 2に 説明したような C S Sビークの縦座標値のソーティングの代わりに、 他のソ一テ イングを利用することもできる。 例えば、 ビークの高さの降順に配置する代わり に昇順に縦座標値を配置してもよい。 データベースにソーティングされた値を保 存する代わりにマッチング手順中にソ一ティングを行ってもよい。 産業上の利用の可能性
本発明によるシステムは例えば画像ライブラリ中に設けることができる。 或い は、 データべ一スは、 インターネットのようなネットワークにより電話線のよう な一時的リンクによって制御装置と接続し、 システムの制御装置から遠隔地に配 置することができる。 例えば、 画像データベースおよび記述子データベースは永 久記憶装置または R O Mや D V Dのような携帯用記憶媒体中に設けることができ る。
以上説明したようなシステムの構成要素は、 ソフトウエアまたはハードウエア の形で設けることができる。 コンピュータ 'システムの形で本発明について説明 したが、 本発明は専用チップなどを用いて他の形で実現することもできる。 オブジェクトの 2 D形状を表す方法および 2つの形状間の類似度を表す値を計 算する方法を示す特定の例を示したが、 同様の任意の適切な方法を用いることが できる。
例えば、 確認目的のためにオブジェクト画像のマッチングを行うために、 また はフィル夕リングを行うために本発明を用いることができる。

Claims

請 求 の 範 囲
1 . 静止画像またはビデオ画像に対応する信号を処理することにより、 前記画 像中に現れるオブジェクトを表す方法であって、
オブジェクトの輪郭上の任意の点から始めて、 前記輪郭上に現れる特徴と関連 する複数の数値を導き出すステップと、
前記値に対して所定のソーティングを適用して前記輪郭の表示を得るステップ と
を有することを特徴とする画像中のオブジェクトを表示する方法。
2 . 結果として得られた前記表示が前記輪郭上の開始点に依存しないように前 言己所定のソーティングがなされる
ことを特徴とする請求項 1に記載の画像中のオブジェクトを表示する方法。
3 . 前記数値が前記曲線上の屈曲点を反映する
ことを特徴とする請求項 1に記載の画像中のオブジェクトを表示する方法。
4 . 平滑化パラメータシグマを用いて複数の段階で前記輪郭を平滑化し、 その 結果複数の輪郭曲線を生じることにより、 また、 各輪郭曲線の曲率の最大値と最 小値を表す値を用いて元の輪郭の特徴を示す曲線を導き出すことにより、 さらに 、 前記数値として前記特徴を示す曲線のビークの縦座標を選択することにより、 前記輪郭の曲率スケール空間の表示を得る
ことを特徴とする請求項 1に記 ¾^適像中のオ ジェクトを表示する方法。
5 . 前記特徴を示す曲線の縦座標が前記輪郭の弧長パラメータと前記平滑化パ ラメ一夕とに対応する
ことを特徴とする請求項 4に記載の画像中のオブジェクトを表示する方法。 前記平滑化パラメ一夕に対応するピークの高さの値に基づいて前記ピーク の縦座標値がソートされる
ことを特徴とする請求項 5に記載の画像中のォブジヱクトを表示する方法。
7 . 前記値が最大値からソートされる
ことを特徴とする請求項 1乃至 6のいずれか 1つに記載の画像中のオブジェク トを表示する方法。
8 . 前記値が大きさの降順にソートされる
ことを特徴とする請求項 7に記載の画像中のオブジェクトを表示する方法。
9 . 前記値が最小値からソートされる
ことを特徴とする請求項 1乃至 6のいずれか 1つに記載の画像中のオブジェク トを表示する方法。
1 0 . 静止画像またはビデオ画像に対応する信号を処理することにより、 前記 画像中に現れるオブジェクトを表す方法であって、
オブジェクトの輪郭を表すために、 前記輪郭上に現れる特徴と関連する複数の 数値を導き出すステップと、
前記値のうちの少なくとも 2つ値の間の関係を用いて前記表示の信頼性を示す 係数を導き出すステップと
を有することを特徴とする画像中のオブジェクトを表示する方法。
1 1 . 前記係数が前記値のうちの 2つの値の間の比に基づく
ことを特徴とする請求項 1 0に記載の画像中のオブジェクトを表示する方法。
1 2 . 前記比が 2つの最大値の比である
ことを特徴とする請求項 1 1に記載の画像中のオブジェクトを表示する方法。
1 3 . 平滑化パラメ一夕シグマを用いて複数の段階で前記輪郭を平滑化し、 そ の結果複数の輪郭曲線を生じることにより、 また、 元の輪郭の特徴を示す曲線を 導き出すための各輪郭曲線の曲率の最大値と最小値を表す値を用いることにより 、 さらに、 前記数値として前記特徴を示す曲線のビークの縦座標を選択すること により、 前記輪郭の曲率スケール空間表示が得られる
ことを特徴とする請求項 1 0乃至 1 2のいずれか 1つに記載の画像中のォブジ ェクトを表示する方法。
1 4 . 請求項 1乃至 9のいずれか 1つに記載の方法を用いて前記値を導き出す ことを特徴とする請求項 1 0に記載の画像中のオブジェクトを表示する方法。
1 5 . 静止画像またはビデオ画像に対応する信号を処理することにより、 前記 画像中のオブジェクトを検索する方法であって、
2次元の輪郭の形でクエリーを入力するステップと、
請求項 1乃至 9のいずれか 1つに記載の方法を用いて前記輪郭の記述子を導き 出すステップと、
請求項 1乃至 9のいずれか 1つに記載の方法を用いて導き出された、 保存され た画像中のオブジェク卜の記述子を取得し、 保存されたォブジェクトの各記述子 と前記クエリ一記述子を比較するステップと、
該比較によって前記クエリーと前記オブジェクトの間の類似度の程度が示され る対象オブジェクトを含む画像に対応する少なくとも 1つの結果を選択し表示す るステップと
を有することを特徴とする画像中のオブジェクトを検索する方法。
1 6 . 請求項 1 0乃至 1 2のいずれか 1つに記載の方法を用いて、 前記クエリ 一の輪郭について、 および、 各保存された輪郭について係数が導き出され、 所定 のソーティングのみを用いて、 または、 前記所定のソーティングと前記係数に依 存する何らかの他のソーティングを用いて比較を行う
ことを特徴とする請求項 1 5に記載の画像中のオブジェクトを検索する方法。
1 7 . 静止画像またはビデオ画像に対応する信号を処理することにより、 前記 画像中に現れる複数のオブジェクトを表す方法であって、
各オブジェク 卜の輪郭上に現れる特徴と関連する複数の数値を導き出すステツ プと、
各輪郭を表す前記値に同じ所定のソーティングを適用して各輪郭の表示を得る ステップと
を有することを特徴とする画像中のオブジェクトを表示する方法。
1 8 . 請求項 1乃至 1 7のいずれか 1つに記載の方法を実行するように適合さ れる画像中のオブジェクトを表示するまたは検索する装置。
1 9 . 請求項 1乃至 1 7のいずれか 1つに記載の方法を実行するように適合さ れる画像中のオブジェクトを表示するまたは検索するコンビュ一夕 ·プログラム
2 0 . 請求項 1乃至 1 7のいずれか 1つに記載の方法に従って作動するように プログラムされた画像中のオブジェクトを表示するまたは検索するコンビユー夕 • システム。
2 1 . 請求項 1乃至 1 7のいずれか 1つに記載の方法を実現するためのコンビ ュ一夕で実行可能な処理を保存するコンビユー夕可読記憶媒体。
2 2 . 添付図面を参照して本明細書で説明したものと実質的に同じように、 静 止画像またはビデオ画像中のオブジェクトを表す画像中のオブジェクトを表示す る方法。
2 3 . 添付図面を参照して本明細書で説明したものと実質的に同じように、 静 止画像またはビデオ画像中のオブジェクトを検索する画像中のオブジェク卜を検 索する方法。
2 4 . 添付図面を参照して本明細書で説明したものと実質的に同じである画像 中のオブジェクトを表示するまたは検索するコンピュータ · システム。
PCT/JP2000/004400 1999-07-05 2000-07-03 Procede et dispositif d'affichage ou de recherche d'objets dans une image, et support de stockage lisible par ordinateur WO2001003068A1 (fr)

Priority Applications (11)

Application Number Priority Date Filing Date Title
KR1020037011345A KR100708799B1 (ko) 1999-07-05 2000-07-03 화상 중에 나타나는 오브젝트를 표시하는 방법, 시스템 및 컴퓨터 판독가능 매체
BR0006894-2A BR0006894A (pt) 1999-07-05 2000-07-03 Processos para representar um objeto e uma pluralidade de objetos que aparecem em uma imagem parada ou de vìdeo processando sinais que correspondem à imagem, para pesquisar um objeto em uma imagem parada ou de vìdeo processando sinais que correspondem a imagens, para representar objetos em imagens paradas ou de vìdeo, e para pesquisar objetos em imagens paradas ou de vìdeo, aparelho, programa de computador, sistema de computador, e, meio de armazenagem que pode ser lido por computador
JP2001508781A JP4689119B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体
US09/763,852 US6882756B1 (en) 1999-07-05 2000-07-03 Method and device for displaying or searching for object in image and computer-readable storage medium
KR1020037011346A KR100708800B1 (ko) 1999-07-05 2000-07-03 화상 중에 나타나는 오브젝트를 검색하는 방법, 시스템 및 컴퓨터 판독가능 매체
US11/101,637 US7162105B2 (en) 1999-07-05 2005-04-08 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
US11/557,836 US7356203B2 (en) 1999-07-05 2006-11-08 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
US11/929,392 US7505637B2 (en) 1999-07-05 2007-10-30 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
US11/929,281 US7542626B2 (en) 1999-07-05 2007-10-30 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
US11/929,434 US7492972B2 (en) 1999-07-05 2007-10-30 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
US11/929,471 US7483594B2 (en) 1999-07-05 2007-10-30 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9915698A GB2351826B (en) 1999-07-05 1999-07-05 Method of representing an object in an image
GB9915698.6 1999-07-05

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US09763852 A-371-Of-International 2000-07-03
US11/101,637 Division US7162105B2 (en) 1999-07-05 2005-04-08 Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image

Publications (2)

Publication Number Publication Date
WO2001003068A1 true WO2001003068A1 (fr) 2001-01-11
WO2001003068A8 WO2001003068A8 (fr) 2001-03-22

Family

ID=10856660

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/004400 WO2001003068A1 (fr) 1999-07-05 2000-07-03 Procede et dispositif d'affichage ou de recherche d'objets dans une image, et support de stockage lisible par ordinateur

Country Status (8)

Country Link
US (7) US6882756B1 (ja)
JP (2) JP4689119B2 (ja)
KR (3) KR100431677B1 (ja)
CN (5) CN1295649C (ja)
BR (1) BR0006894A (ja)
GB (5) GB2391676B (ja)
RU (1) RU2216040C2 (ja)
WO (1) WO2001003068A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2349493B (en) 1999-04-29 2002-10-30 Mitsubishi Electric Inf Tech Method of representing an object using shape
GB2393839B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
GB2359913B (en) * 2000-02-29 2003-12-03 Mitsubishi Electric Inf Tech A method for efficient coding of shape descriptor parameters
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
GB2384095B (en) * 2001-12-10 2004-04-28 Cybula Ltd Image recognition
US7656408B1 (en) * 2006-02-10 2010-02-02 Adobe Systems, Incorporated Method and system for animating a border
US7711157B2 (en) * 2006-08-01 2010-05-04 California Institute Of Technology Artificial intelligence systems for identifying objects
US20080181513A1 (en) * 2007-01-31 2008-07-31 John Almeida Method, apparatus and algorithm for indexing, searching, retrieval of digital stream by the use of summed partitions
GB2449125A (en) * 2007-05-11 2008-11-12 Sony Uk Ltd Metadata with degree of trust indication
JP5041229B2 (ja) * 2007-12-07 2012-10-03 ソニー株式会社 学習装置および方法、認識装置および方法、並びにプログラム
US8532438B2 (en) * 2008-05-09 2013-09-10 Empire Technology Development Llc Matching images with shape descriptors
US8340435B2 (en) * 2009-06-11 2012-12-25 California Institute Of Technology Method and system for object recognition search
JP5444115B2 (ja) * 2010-05-14 2014-03-19 株式会社Nttドコモ データ検索装置、データ検索方法及びプログラム
US9135522B2 (en) 2012-02-27 2015-09-15 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi System and method for identifying scale invariant features of object outlines on images
CN103870516B (zh) 2012-12-18 2019-10-25 北京三星通信技术研究有限公司 检索图像的方法、实时绘画提示方法及其装置
KR101567792B1 (ko) 2013-04-01 2015-11-20 아셀산 엘렉트로닉 사나이 베 티카렛 아노님 시르케티 이미지 윤곽 묘사 시스템 및 방법
WO2015080723A1 (en) * 2013-11-27 2015-06-04 Hewlett-Packard Development Company, Lp. Determine the shape of a representation of an object
KR102312334B1 (ko) 2015-02-17 2021-10-13 삼성전자주식회사 프린팅 정보를 생성하는 디바이스 및 프린팅 정보를 생성하는 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0275083A (ja) * 1988-09-12 1990-03-14 Nippon Yougiyoushi Kenkyusho:Kk 考古学出土品の輪郭描画装置
JPH06309465A (ja) * 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
JPH1055447A (ja) * 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0293397A1 (en) * 1986-09-18 1988-12-07 LEAVERS, Violet Frances Shape detection
GB2203877A (en) * 1986-09-18 1988-10-26 Violet Frances Leavers Shape parametrisation
US4989257A (en) * 1987-03-13 1991-01-29 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
JPH0283A (ja) * 1987-10-29 1990-01-05 Kawasaki Steel Corp 乾式二成分系現像剤用キャリア
US5081689A (en) * 1989-03-27 1992-01-14 Hughes Aircraft Company Apparatus and method for extracting edges and lines
JPH0820725B2 (ja) * 1990-02-06 1996-03-04 大日本スクリーン製造株式会社 画像輪郭データの作成方法
JP2856229B2 (ja) * 1991-09-18 1999-02-10 財団法人ニューメディア開発協会 画像切り出し箇所検出方法
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
US5487116A (en) * 1993-05-25 1996-01-23 Matsushita Electric Industrial Co., Ltd. Vehicle recognition apparatus
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
US6044171A (en) * 1995-05-09 2000-03-28 Polyakov; Vladislav G. Method and apparatus for pattern recognition and representation using fourier descriptors and iterative transformation-reparametrization
JPH09138471A (ja) 1995-09-13 1997-05-27 Fuji Photo Film Co Ltd 特定形状領域の抽出方法、特定領域の抽出方法及び複写条件決定方法
JP3315861B2 (ja) * 1996-05-13 2002-08-19 シャープ株式会社 文字生成装置
JP2815045B2 (ja) * 1996-12-16 1998-10-27 日本電気株式会社 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
US5892854A (en) * 1997-01-21 1999-04-06 Xerox Corporation Automatic image registration using binary moments
WO1999017250A1 (en) * 1997-10-01 1999-04-08 Island Graphics Corporation Image comparing system
KR100305591B1 (ko) * 1998-07-22 2001-11-30 오길록 관절점기반동작정보를사용한동영상검색방법
JP2000050258A (ja) * 1998-07-31 2000-02-18 Toshiba Corp 映像検索方法および映像検索装置
US6687402B1 (en) * 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
GB2349493B (en) * 1999-04-29 2002-10-30 Mitsubishi Electric Inf Tech Method of representing an object using shape
GB2393839B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0275083A (ja) * 1988-09-12 1990-03-14 Nippon Yougiyoushi Kenkyusho:Kk 考古学出土品の輪郭描画装置
JPH06309465A (ja) * 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
JPH1055447A (ja) * 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Lecture Notes in Computer Science, Vol. 1252, issued 1997 (Heidelberg, Germany), pages 284-295, S. Abbasi et al., "Reliable Classification of Chrysanthemum Leaves through Curvature Scale Space". *
Lecture Notes in Computer Science, Vol. 1311, issued 1997 (Heidelberg, Germany), pages 140-147, F. Mokhtarian et al., "A New Approach to Computation of Curvature Scale Space Image for Shape Similarity Retrieval". *

Also Published As

Publication number Publication date
US6882756B1 (en) 2005-04-19
JP2011100467A (ja) 2011-05-19
GB0329009D0 (en) 2004-01-14
US7483594B2 (en) 2009-01-27
US7492972B2 (en) 2009-02-17
GB2393012A (en) 2004-03-17
KR100708799B1 (ko) 2007-04-18
GB2351826A (en) 2001-01-10
CN1542695A (zh) 2004-11-03
CN100573521C (zh) 2009-12-23
US20080065610A1 (en) 2008-03-13
GB9915698D0 (en) 1999-09-08
CN1321284A (zh) 2001-11-07
US7162105B2 (en) 2007-01-09
KR100431677B1 (ko) 2004-05-17
CN1295649C (zh) 2007-01-17
GB2391677A (en) 2004-02-11
CN1967543A (zh) 2007-05-23
GB2391676B (en) 2004-05-05
KR20030078952A (ko) 2003-10-08
CN100573522C (zh) 2009-12-23
GB2351826B (en) 2004-05-19
RU2216040C2 (ru) 2003-11-10
GB0325150D0 (en) 2003-12-03
BR0006894A (pt) 2001-06-12
CN1967544A (zh) 2007-05-23
JP4875200B2 (ja) 2012-02-15
GB2391676A (en) 2004-02-11
GB2391678B (en) 2004-05-05
US7505637B2 (en) 2009-03-17
CN1311411C (zh) 2007-04-18
GB2391677B (en) 2004-05-12
CN1967543B (zh) 2010-05-26
KR100708800B1 (ko) 2007-04-18
WO2001003068A8 (fr) 2001-03-22
US7356203B2 (en) 2008-04-08
GB2391678A (en) 2004-02-11
JP4689119B2 (ja) 2011-05-25
CN1967542A (zh) 2007-05-23
US20080044108A1 (en) 2008-02-21
US20080050048A1 (en) 2008-02-28
GB2393012B (en) 2004-05-05
GB0325153D0 (en) 2003-12-03
US20070065016A1 (en) 2007-03-22
GB0325156D0 (en) 2003-12-03
US20080050049A1 (en) 2008-02-28
KR20030078953A (ko) 2003-10-08
US20050238256A1 (en) 2005-10-27
US7542626B2 (en) 2009-06-02
KR20010073126A (ko) 2001-07-31

Similar Documents

Publication Publication Date Title
JP4875200B2 (ja) 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体
US7430338B2 (en) Method and device for processing and for searching for an object by signals corresponding to images
JP2011100465A (ja) 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体
MXPA01002354A (es) Metodo, aparato programa de computadora, sistema de computadora, y medio de almacenamiento leible por computadora para representar y buscar un objeto en una imagen

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 00801910.X

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): BR CN IN JP KR MX RU US

WWE Wipo information: entry into national phase

Ref document number: 09763852

Country of ref document: US

Ref document number: IN/PCT/2001/277/CHE

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: PA/a/2001/002354

Country of ref document: MX

Ref document number: 1020017002862

Country of ref document: KR

AK Designated states

Kind code of ref document: C1

Designated state(s): BR CN IN JP KR MX RU US

CFP Corrected version of a pamphlet front page

Free format text: UNDER (54) PUBLISHED TITLE IN JAPANESE REPLACED BY CORRECT TITLE

WWP Wipo information: published in national office

Ref document number: 1020017002862

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1020017002862

Country of ref document: KR