JP2004013306A - Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium - Google Patents
Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium Download PDFInfo
- Publication number
- JP2004013306A JP2004013306A JP2002162957A JP2002162957A JP2004013306A JP 2004013306 A JP2004013306 A JP 2004013306A JP 2002162957 A JP2002162957 A JP 2002162957A JP 2002162957 A JP2002162957 A JP 2002162957A JP 2004013306 A JP2004013306 A JP 2004013306A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- distance
- individual
- feature amount
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004364 calculation method Methods 0.000 title claims description 164
- 238000013500 data storage Methods 0.000 title claims description 15
- 238000010606 normalization Methods 0.000 claims abstract description 133
- 238000009826 distribution Methods 0.000 claims abstract description 49
- 230000005236 sound signal Effects 0.000 claims description 61
- 238000000605 extraction Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、類似度計算装置、インデックスデータ生成装置、映像または音声データベース装置、類似度計算方法、インデックスデータ生成方法、内容表現データ記憶装置、および、記録媒体に関し、特に、映像・音声類似検索のための類似度計算装置、インデックスデータ生成装置、映像または音声データベース装置、類似度計算方法、インデックスデータ生成方法、内容表現データ記憶装置、および、記録媒体に関する。
【0002】
【従来の技術】
映像または音声信号の特徴をインデックス信号としてデータベースに格納し、インデックス信号間の距離を測ることによって映像または音声信号間の類似度をもとめ、これにより類似映像・音声検索を実装する方式が広く使われている。インデックス信号として利用可能な信号特徴量には様々なものがあり、それらを複数利用することによって類似判定精度を高めることができる。複数の信号特徴量を用いる手法として例えば、特開2000−285141、特開2000−163576、特開2000−048181、特開平11−039325、特開平09−204440、特開平09−101970があげられる。なお以下では類似度の代わりに一般に広く使われる距離測定(どのくらい似ていないかを示す)によって代用する。例えば距離の逆数をとることによって類似度を求めることが可能である。
【0003】
特開2000−285141では、複数の利用可能な信号特徴の種別を利用者に提示して、それらの中から利用者が選択したものを用いる。距離判定においては、選択した信号特徴量それぞれの信号特徴量間距離を合計することによって総合的な類似度を算出する。算出に際しては、それぞれの個別信号特徴量の重要性が異なることから、ユーザによって重みづけという概念を導入することを許容している。
【0004】
特開2000−163576は、これとは少し異なる概念の元に設計されており、映像信号を領域分割した上で、個々の領域ごとに特徴量を計算し、それらを領域面積により重み付け加算することによって全体的な距離を計算している。この例では、特開2000−285141でユーザに一任した重要度判定を領域の面積により自動計算することが特徴となっている。特開平11−039325は、重み付けに学習効果を導入するもので学習過程を通してユーザが好ましいと望むように重み付けを設定している。特開平09−204440も同様の考え方に基づくもので事前学習を行う代わりに検索結果を表示したもののうちどれをユーザが選択したかを追跡し、ユーザが重要視していると考えられる特徴量に対して重みをつける。とく開閉09−101970もまったく同様の構図の上で設計されており、重みを次第に重くすることによって、過度の重み付けを防いでおり、学習をリアルタイムに実施することと等価である。
【0005】
特開2000−048181も自動的な重み付けを工夫する手法で、問い合わせ画像の彩度及びテクスチャ強度に比例して重み付け値を設定している。
【0006】
【発明が解決しようとする課題】
これらの手法は複数の特徴量を併用する場合の相互関係を重み付けという概念で規定する手法であるが、本来特徴量はそれぞれ独立に設計されており、ある特徴量は0−100、別の特徴量は0−5といったレンジで変化する。上記の例ではこれらは全て重み付けという概念で吸収しているが、特開2000−048181が指摘している通り、本来ダイナミックレンジの異なる特徴量を正規化した上でユーザ嗜好を反映する重み係数を導入することが望ましい。なぜならば特定の嗜好を持たない一般的な状況下においては、正規化された特徴量の合計が総合的な特徴量を示すからである。特開2000−048181は正規化した上で重み付け導入をうたっているが、この発明では重みつけ設計の方法に主眼がおかれ正規化の手法は外部で定義されることを前提としている。正規化の手法として容易に類推できる方法はそれぞれの特徴量が持つ理論的なダイナミックレンジにより除算して、特徴量を0−1の範囲内で変化するように帰着させる手法である。一般論としてこの手法はあらゆる場面で適用可能であるが、実際にこれを適用した場合に十分な性能が得られないという問題がある。
【0007】
これは理論上のダイナミックレンジと一般的な映像音声信号から発生する信号特徴量の値域が必ずしも一致しないためで0−1内に分布させたつもりが特徴量によっては0.5〜0.8等の狭い範囲内での分布となっている可能性があるためである。
【0008】
複数の特徴量を用いる類似検索システムにおいて、適切な正規化手法を提供することにある。
【0009】
映像音声信号のデータベースは本来何らかの目的を持ってコンテンツ登録がなされている。類似検索の目的はこの登録されたコンテンツを効率的に整理する手段を与えることである。そこで本発明では、データベース登録された信号 がなるべく距離空間内で均等分布して分類が容易になるように、登録された信号の特徴量分布から実効的なダイナミックレンジを測定してその値を正規化に用いることを特徴とする。また、本発明は、正規化を実施する手法としては特徴量空間で行う手法と距離空間で行う手法の2種類を提供し、アプリケーションが要求する装置規模、計算リソース、精度に応じてこれらの使い分けを可能にすることを特徴とする。
【0010】
【課題を解決するための手段】
本発明の第1の類似度計算装置は、問い合わせ信号となる映像または音声信号と、データベースにあらかじめ登録された複数の映像または音声信号間の距離を算出する類似度計算装置において、前記問い合わせ信号から複数の信号特徴量を算出する問い合わせ信号特徴量抽出部と、前記抽出した信号特徴量とデータベースに登録された個々の映像または音声信号の複数の映像特徴量からそれぞれの信号特徴量間の距離を計算する個別信号特徴量間距離算出部と、前記個別信号特徴量間距離算出部が出力する問い合わせ信号と個々のデータベース登録信号間の個別特徴量間距離群を信号特徴量種別毎に統計処理し、信号特徴量毎の距離分布状況を示す統計量を出力する特徴量間距離分布状況計算部と、前記個別信号特徴量間距離算出部が算出した個別信号特徴量間距離を前記距離分布状況を示す統計量を用いて正規化する個別信号特徴量間距離正規化部と、正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする。
【0011】
本発明の第2の類似度計算装置は、前記第1の類似度計算装置であって、類似度計算装置において、前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の最小値と最大値からなることを特徴とする。
【0012】
本発明の第3の類似度計算装置は、前記第2の類似度計算装置であって、類似度計算装置において、前記個別信号特徴量間距離正規化部が、個別特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0013】
本発明の第4の類似度計算装置は、前記第1の類似度計算装置であって、類似度計算装置において、前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の平均値と分散値からなることを特徴とする。
【0014】
本発明の第5の類似度計算装置は、前記第4の類似度計算装置であって、類似度計算装置において、前記個別信号特徴量間距離正規化部が、個別特徴量間距離から前記平均値を減算した上で減算結果を前記分散値で除算することにより正規化を実施することを特徴とする。
【0015】
本発明の第6の類似度計算装置は、2つの映像または音声信号間の類似度を複数の信号特徴量と複数の信号特徴量それぞれに対応する正規化指標を用いて計算する類似度計算装置において、第一の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第一の信号特徴量正規化部と、第二の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第二の信号特徴量正規化部と、第一の映像または音声信号の個々の正規化された信号特徴量と、第二の映像または音声信号の対応する正規化された信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出部と、前記個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする。
【0016】
本発明の第7の類似度計算装置は、前記第6の類似度計算装置であって、類似度計算装置において、入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする。
【0017】
本発明の第8の類似度計算装置は、前記第7の類似度計算装置であって、類似度計算装置において、個別信号特徴量正規化部は、個別信号特徴量を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0018】
本発明の第9の類似度計算装置は、前記第6の類似度計算装置であって、類似度計算装置において、入力である正規化指標が信号特徴量の分散値及び平均値であることを特徴とする。
【0019】
本発明の第10の類似度計算装置は、前記第9の類似度計算装置であって、類似度計算装置において、個別信号特徴量正規化部は、個別信号特徴量から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする。
【0020】
本発明の第11の類似度計算装置は、2つの映像または音声信号間の類似度を複数の信号特徴量と複数の信号特徴量それぞれに対応する正規化指標を用いて計算する類似度計算装置において、第一の映像または音声信号の個々の信号特徴量と、第二の映像または音声信号の対応する信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出部と、算出された前記信号特徴量間距離それぞれを対応する正規化指標を用いて正規化し正規化された個別信号特徴量間距離を計算する個別信号特徴量間距離正規化部と、前記正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする。
【0021】
本発明の第12の類似度計算装置は、前記第11の類似度計算装置であって、類似度計算装置において、入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする。
【0022】
本発明の第13の類似度計算装置は、前記第12の類似度計算装置であって、類似度計算装置において、個別信号特徴量間距離正規化部は、個別信号特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0023】
本発明の第14の類似度計算装置は、前記第11の類似度計算装置であって、類似度計算装置において、入力である正規化指標が信号特徴量の平均値及び分散値であることにより正規化を実施することを特徴とする。
【0024】
本発明の第15の類似度計算装置は、前記第14の類似度計算装置であって、類似度計算装置において、個別信号特徴量間距離正規化部は、個別信号特徴量間距離から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする。
【0025】
本発明の第1のインデックスデータ生成装置は、映像または音声信号の複数の信号特徴量を格納する映像または音声データベースのインデックスデータ生成装置において、入力される映像または音声信号から複数の信号特徴量を抽出する信号特徴量抽出部に加えて、抽出された特徴量と登録済みの特徴量から、個々の特徴量それぞれについてその統計量を算出する特徴量分布状況算出部と、前記統計量を映像または音声データベースに出力する特徴量分布状況記録部からなることを特徴とする。
【0026】
本発明の第2のインデックスデータ生成装置は、インデックスデータ生成装置において、統計量としてそれぞれの特徴量の平均値および分散値を用いることを特徴とする。
【0027】
本発明の第3のインデックスデータ生成装置は、前記第1のインデックスデータ生成装置であって、インデックスデータ生成装置において、統計量としてそれぞれの特徴量の最大値および最小値を用いることを特徴とする。
【0028】
本発明の第1の映像または音声データベース装置は、映像または音声信号の複数の信号特徴量を格納する映像または音声データベース装置において、登録されているここの映像信号から抽出した複数の信号特徴量統計量に加えて、それぞれの特徴量の統計的性質をあらわす指標をも格納することを特徴とする。
【0029】
本発明の第2の映像または音声データベース装置は、前記第1の映像または音声データベース装置であって、映像または音声データベース装置において、特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の平均値及び分散値を用いることを特徴とする。
【0030】
本発明の第3の映像または音声データベース装置は、前記第1の映像または音声データベース装置であって、映像または音声データベース装置において、特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の最小値および最大値を用いることを特徴とする。
【0031】
本発明の第1の類似度計算方法は、問い合わせ信号となる映像または音声信号と、データベースにあらかじめ登録された複数の映像または音声信号間の距離を算出する類似度計算方法において、前記問い合わせ信号から複数の信号特徴量を算出する問い合わせ信号特徴量抽出過程と、前記抽出した信号特徴量とデータベースに登録された個々の映像または音声信号の複数の映像特徴量からそれぞれの信号特徴量間の距離を計算する個別信号特徴量間距離算出過程と、前記個別信号特徴量間距離算出部が出力する問い合わせ信号と個々のデータベース登録信号間の個別特徴量間距離群を信号特徴量種別毎に統計処理し、信号特徴量毎の距離分布状況を示す統計量を出力する特徴量間距離分布状況計算過程と、前記個別信号特徴量間距離算出仮定で算出した個別信号特徴量間距離を前記距離分布状況を示す統計量を用いて正規化する個別信号特徴量間距離正規化過程と、正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする。
【0032】
本発明の第2の類似度計算方法は、前記第1の類似度計算方法であって、類似度計算方法において、前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の最小値と最大値からなることを特徴とする。
【0033】
本発明の第3の類似度計算方法は、前記第2の類似度計算方法であって、類似度計算方法において、前記個別信号特徴量間距離正規化過程が、個別特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0034】
本発明の第4の類似度計算方法は、前記第1の類似度計算方法であって、類似度計算方法において、前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の平均値と分散値からなることを特徴とする。
【0035】
本発明の第5の類似度計算方法は、前記第4の類似度計算方法であって、類似度計算方法において、前記個別信号特徴量間距離正規化過程が、個別特徴量間距離から前記平均値を減算した上で減算結果を前記分散値で除算することにより正規化を実施することを特徴とする。
【0036】
本発明の第6の類似度計算方法は、2つの映像または音声信号間の類似度を複数の信号特徴量と複数の信号特徴量それぞれに対応する正規化指標を用いて計算する類似度計算方法において、第一の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第一の信号特徴量正規化過程と、第二の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第二の信号特徴量正規化過程と、第一の映像または音声信号の個々の正規化された信号特徴量と、第二の映像または音声信号の対応する正規化された信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出過程と、前記個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする。
【0037】
本発明の第7の類似度計算方法は、前記第6の類似度計算方法であって、類似度計算方法において、入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする。
【0038】
本発明の第8の類似度計算方法は、前記第7の類似度計算方法であって、類似度計算方法において、個別信号特徴量正規化過程は、個別信号特徴量を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0039】
本発明の第9の類似度計算方法は、前記第6の類似度計算方法であって、類似度計算方法において、入力である正規化指標が信号特徴量の分散値及び平均値であることを特徴とする。
【0040】
本発明の第10の類似度計算方法は、前記第9の類似度計算方法であって、類似度計算方法において、個別信号特徴量正規化過程は、個別信号特徴量から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする。
【0041】
本発明の第11の類似度計算方法は、2つの映像または音声信号間の類似度を複数の信号特徴量と複数の信号特徴量それぞれに対応する正規化指標を用いて計算する類似度計算方法において、第一の映像または音声信号の個々の信号特徴量と、第二の映像または音声信号の対応する信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出過程と、算出された前記信号特徴量間距離それぞれを対応する正規化指標を用いて正規化し正規化された個別信号特徴量間距離を計算する個別信号特徴量間距離正規化過程と、前記正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする。
【0042】
本発明の第12の類似度計算方法は、前記第11の類似度計算方法であって、類似度計算方法において、入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする。
【0043】
本発明の第13の類似度計算方法は、前記第12の類似度計算方法であって、類似度計算方法において、個別信号特徴量間距離正規化過程は、個別信号特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする。
【0044】
本発明の第14の類似度計算方法は、前記第11の類似度計算方法であって、類似度計算方法において、入力である正規化指標が信号特徴量の平均値及び分散値であることを特徴とする。
【0045】
本発明の第15の類似度計算方法は、前記第14の類似度計算方法であって、類似度計算方法において、個別信号特徴量間距離正規化過程は、個別信号特徴量間距離から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする。
【0046】
本発明の第1のインデックスデータ生成方法は、映像または音声信号の複数の信号特徴量を格納する映像または音声データベースのインデックスデータ生成方法において、入力される映像または音声信号から複数の信号特徴量を抽出する信号特徴量抽出過程に加えて、抽出された特徴量と登録済みの特徴量から、個々の特徴量それぞれについてその統計量を算出する特徴量分布状況算出過程と、前記統計量を映像または音声データベースに出力する特徴量分布状況記録過程からなることを特徴とする。
【0047】
本発明の第2のインデックスデータ生成方法は、前記第1のインデックスデータ生成方法であって、インデックスデータ生成方法において、統計量としてそれぞれの特徴量の平均値および分散値を用いることを特徴とする。
【0048】
本発明の第3のインデックスデータ生成方法は、前記第1のインデックスデータ生成方法であって、統計量としてそれぞれの特徴量の最大値および最小値を用いることを特徴とする。
【0049】
本発明の第1の映像または音声内容表現データ記憶装置は、映像または音声信号の複数の信号特徴量を格納する映像または音声信号の内容表現データ記憶装置において、登録されているここの映像信号から抽出した複数の信号特徴量統計量に加えて、それぞれの特徴量の統計的性質をあらわす指標もが含まれることを特徴とする。
【0050】
本発明の第2の映像または音声内容表現データ記憶装置は、前記第1の映像または音声内容表現データ記憶装置であって、特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の平均値及び分散値を用いることを特徴とする。
【0051】
本発明の第3の映像または音声内容表現データ記憶装置は、前記第1の映像または音声内容表現データ記憶装置であって、
特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の最小値および最大値を用いることを特徴とする。
【0052】
本発明の記録媒体は、前記請求項類似度計算方法または前記信号特徴量インデックス作成方法を格納したことを特徴とする。
【0053】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して詳細に説明する。図1は距離空間で特徴量の正規化を行う手法の一実施例である。
この実施例は問い合わせ信号101とデータベースに登録された信号の特徴量である登録信号特徴量103から登録信号と問い合わせ信号の間の信号類似度107(距離)を出力するもので、信号特徴量抽出部10、個別特徴量間距離算出部11、距離分布状況計算部12、個別特徴量間距離正規化部13、信号類似度算出部14からなる。
信号特徴量抽出部10は、問い合わせ信号101から複数種類の問い合わせ信号特徴量102を抽出する。以下、抽出されたN種類の特徴量を{Fi:(i=1,2,・・・,N)}とする。個々の特徴量としては、たとえばアイ・エス・オー、アイ・イー・シー15938マルチメディア・コンテンツ・ディスクリプション・インタフェイス(ISO/IEC 15938 Multimedia Content Description Interface)に記載の信号特徴量を利用することができる。個々の信号特徴量がベクトル量である場合には、スカラ量であるその構成要素それぞれを「個々の信号特徴量」として独立に扱ってもよい。データベースにはM個の登録信号それぞれに対する特徴量である登録信号特徴量103{G(j)i:(i=1,2,・・・,N)(j=1,2,・・・,M)}が登録されており、個別特徴量間距離算出部11は、抽出された問い合わせ信号特徴量102と、登録信号特徴量103の間で、それぞれの特徴量の種類ごとに距離計算を行う。この結果得られる個別特徴量間距離104を{d(問い合わせ信号、第j登録信号)i:(i=1,2,・・・,N)(j=1,2,・・・,M)}と表記する。個別特徴間距離104は、距離分布状況計算部12と個別特徴量間距離正規化部13に送られる。距離分布状況計算部12は、個別特徴間距離104から個別特徴間距離104の統計的性質を示す距離分布指標105を生成するもので、距離分布指標105としては、例えば最小値、最大値、分散値、平均値など任意の統計的性質を示す指標を利用可能である。
【0054】
個別特徴量間距離正規化部13は、個別特徴量間距離104と距離分布指標105から正規化された個別特徴量間距離106を求める。例えば個別特徴量間距離104において個々の特徴量種別毎の距離分布がガウス分布をしている場合には、平均値と分散値を用いて(d(問い合わせ信号、第j登録信号)i−第i特徴量間距離の平均値)/第i特徴量間距離の分散値により正規化を実現できる。同様に例えば個別特徴量間距離104において個々の特徴量種別毎の距離分布が一様分布をしているならば、最小値と最大値を用いて、d(問い合わせ信号、第j登録信号)i/(第i特徴量間距離の最大値−第i特徴量間距離の最小値)により正規化を実現できる。
【0055】
正規化処理結果である正規化された個別特徴量間距離106を総合し、信号類似度算出部14で問い合わせ信号と登録済み信号間の信号類似度107{D(問い合わせ信号、第j登録信号)i:(j=1,2,・・・,M)}を生成する。正規化された個別特徴量間距離106から信号類似度107を求めるには、個々の距離の絶対値和や二乗和等様々な手法を利用することができる。
【0056】
この発明は従来手法と比較して恣意的に設定した重み付け値を実施する代わりに距離分布状況計算部12が生成する距離分布指標105を用いて個別特徴間距離正規化部13で正規化を行うことが特徴であるが、信号類似度算出部14の手前に従来手法で使われている重み付け回路を追加して挿入しても問題なく、既存の任意の手法と組み合わせ可能である。
【0057】
図2は特徴量空間で特徴量の正規化を行う手法の一実施例である。
この実施例は問い合わせ信号101とデータベースに登録された信号の特徴量である登録信号特徴量103、および個々の特徴量の正規化方法を規定する特徴量正規化指標108から登録信号と問い合わせ信号の間の信号類似度107(距離)を出力するもので、信号特徴量抽出部10、問い合わせ個別特徴量正規化部15、登録個別特徴量正規化部16、個別特徴量間距離算出部11、信号類似度算出部14からなる。
【0058】
信号特徴量抽出部10は、問い合わせ信号101から複数種類の問い合わせ信号特徴量102を抽出する。データベースには第一の実施例で示した登録信号特徴量103の他に、個々の特徴量をどのように正規化すべきかを示す特徴量正規化指標108{Li:(i=1,2,・・・,N)}が登録されている。問い合わせ信号特徴量102は問い合わせ個別特徴量正規化部15で、登録信号特徴量103は登録個別特徴量正規化部16で、それぞれ正規化され、正規化された問い合わせ信号特徴量109と正規化された登録信号特徴量110が生成される。特徴量正規化指標108は、登録済みの信号特徴量の統計的特徴を示すもので、例えば個々の特徴量種別における最小値、最大値、分散値、平均値など任意の統計的性質を示す指標を利用可能である。正規化処理を実施する問い合わせ個別特徴量正規化部15または登録個別特徴量正規化部16における正規化の手法として、例えば登録信号特徴量103がガウス分布をしている場合には、平均値と分散値を用いて、(第i特徴量−第i特徴量の平均値)/第i特徴量の分散値により、正規化を実現できる。
【0059】
同様に例えば個々の特徴量が一様分布をしているならば、最小値と最大値を用いて、第i特徴量/(第i特徴量の最大値−第i特徴量の最小値)により正規化を実現できる。
【0060】
個々の特徴量は既に正規化されているため、個々の特徴量種別ごとに単純距離計算を個別特徴量距離算出部11で計算し、その結果である個別特徴量間距離111を信号類似度算出部14でスカラー量とすることによって総合的な類似度が計算できる。個別特徴量間距離111から総合的な信号間距離(類似度に反比例)を求めるには、個々の距離の絶対値和や二乗和等様々な手法を利用することができる。
【0061】
なお本実施例では個別特徴量間距離算出部11において、個別特徴量間距離111を算出する前に、問い合わせ個別特徴量正規化部15および登録個別特徴量正規化部16にて正規化を実施しているが、正規化処理の線形性から自明なように、問い合わせ信号特徴量102と登録信号特徴量103を直接個別特徴量間距離算出部11に入力した後に、個別特徴量間距離算出部11の出力を特徴量正規化指標108で個々の要素毎に正規化しても同様の効果が得られる。
【0062】
図3は特徴量空間で正規化を実施する場合に必要となる正規化指標をも併せ持ったデータベースを構築するための、インデックスデータ生成システムの一実施例である。
【0063】
この実施例は登録信号特徴量103をすでに保持するデータベースに新規登録信号112から取り出したインデックス信号を追加し、あわせてデータベースに記録される特徴量正規化指標108を出力するシステムで、信号特徴量抽出部10と特徴量分布状況計算部17から構成される。
【0064】
新規登録信号112は信号特徴量抽出部10に入力され新規登録信号特徴量113が生成される。生成された新規登録信号特徴量113はデータベースに登録するためにシステムから出力されると共に、特徴量分布状況計算部17にも同時に入力される。特徴量分布状況計算部17はデータベースに登録されている信号の特徴量である登録信号特徴量103をすべて読み込み、新規登録信号特徴量113とあわせて統計処理をして特徴量正規化指標108を生成する。前述のように特徴量正規化指標108は登録済みの信号特徴量の統計的特徴を示すもので、例えば均一分布する特徴量種別における最小値、最大値やガウス分布する特徴量種別における分散値、平均値など任意の統計的性質を示す指標を利用可能である。データベースは登録信号特徴量103のほかに特徴量正規化指標108をも保持しているが、新規に信号登録をする際には本実施例を用いて保持している特徴量正規化指標108を毎回更新する。
【0065】
【発明の効果】
以上説明したように、本発明においては、次のような効果を奏する。
【0066】
第一の効果は、複数の信号特徴量を併用する検索システムで異なる値域を持つ特徴量間の適切な相対評価ができることにある。
【0067】
正規化は一般的な状況下ではなく、データベースに最適化された状態でなされるので、データベースに登録されている信号をより適切に整理することが可能になる。
第二の効果は、距離空間ではなく特徴量空間での正規化を実行することで、距離計算毎に正規化パラメータ計算処理を繰り返す処理を省略することができ、システムの規模が小規模にできることにある。
【図面の簡単な説明】
【図1】本発明の実施の形態の距離空間で適応的正規化を実施する構成のブロック図である。
【図2】本発明の実施の形態の特徴量空間で適応的正規化処理を行う構成のブロック図である。
【図3】本発明の実施の形態のインデックスデータ生成システムのブロック図である。
【符号の説明】
10 信号特徴量抽出部
11 個別特徴量間距離算出部
12 距離分布状況計算部
13 個別特徴量間距離正規化部
14 信号類似度算出部
15 問い合わせ個別特徴量正規化部
16 登録個別特徴量正規化部
17 特徴量分布状況計算部
101 問い合わせ信号
102 問い合わせ信号特徴量
103 登録信号特徴量
104 個別特徴量間距離
105 距離分布指標
106 正規化された個別特徴量間距離
107 信号類似度
108 特徴量正規化指標
109 正規化された問い合わせ信号特徴量
110 正規化された登録信号特徴量
111 個別特徴量間距離
112 新規登録信号
113 新規登録信号特徴量[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a similarity calculation device, an index data generation device, a video or audio database device, a similarity calculation method, an index data generation method, a content expression data storage device, and a recording medium. Calculation device, index data generation device, video or audio database device, similarity calculation method, index data generation method, content expression data storage device, and recording medium for the same.
[0002]
[Prior art]
Widely used is a method of storing the characteristics of video or audio signals as an index signal in a database, measuring the distance between the index signals to determine the similarity between the video or audio signals, and implementing a similar video / audio search. ing. There are various signal feature amounts that can be used as index signals, and similarity determination accuracy can be improved by using a plurality of them. Examples of the method using a plurality of signal feature amounts include JP-A-2000-285141, JP-A-2000-163576, JP-A-2000-048181, JP-A-11-039325, JP-A-09-204440, and JP-A-09-101970. In the following, instead of the similarity, a commonly used distance measurement (indicating how dissimilar) is used. For example, it is possible to obtain the similarity by taking the reciprocal of the distance.
[0003]
In Japanese Patent Application Laid-Open No. 2000-285141, a plurality of types of available signal features are presented to a user, and a type selected by the user from among them is used. In the distance determination, the total similarity is calculated by summing the distances between the signal feature amounts of the selected signal feature amounts. At the time of calculation, the importance of each individual signal feature is different, so that the concept of weighting is allowed to be introduced by the user.
[0004]
Japanese Patent Application Laid-Open No. 2000-163576 is designed based on a concept slightly different from that described above, in which a video signal is divided into regions, a feature amount is calculated for each region, and these are weighted and added by a region area. To calculate the overall distance. This example is characterized in that the importance determination determined by the user in JP-A-2000-285141 is automatically calculated based on the area of the region. Japanese Patent Application Laid-Open No. H11-039325 introduces a learning effect to weighting, and sets weighting as desired by a user through a learning process. Japanese Patent Laid-Open No. 09-204440 is based on the same idea, and instead of performing pre-learning, traces which one of the displayed search results is selected by the user, and calculates the feature amount considered to be important by the user. Weighting. In particular, the opening / closing 09-101970 is also designed on the same composition, and the weight is gradually increased to prevent excessive weighting, which is equivalent to performing learning in real time.
[0005]
Japanese Patent Application Laid-Open No. 2000-048181 also employs a method of devising automatic weighting, and sets a weighting value in proportion to the saturation and texture strength of an inquiry image.
[0006]
[Problems to be solved by the invention]
These methods define the mutual relationship in the case of using a plurality of feature amounts in combination with the concept of weighting, but the feature amounts are originally designed independently. One feature amount is 0-100, and another feature amount is different. The amount varies in a range such as 0-5. In the above example, these are all absorbed by the concept of weighting. However, as pointed out in Japanese Patent Application Laid-Open No. 2000-048181, a weighting factor that reflects the user's preference after normalizing feature amounts that originally have different dynamic ranges is used. It is desirable to introduce. This is because, under a general situation without a particular preference, the sum of normalized feature amounts indicates an overall feature amount. Japanese Patent Application Laid-Open No. 2000-048181 claims that weighting is introduced after normalization. However, in the present invention, it is assumed that the emphasis is on the weighting design method and that the normalization method is externally defined. A method that can be easily analogized as a normalization method is a method of dividing the characteristic amount by the theoretical dynamic range of each characteristic amount and reducing the characteristic amount so as to change within a range of 0-1. As a general theory, this method can be applied in every situation, but there is a problem that sufficient performance cannot be obtained when it is actually applied.
[0007]
This is because the theoretical dynamic range and the value range of signal features generated from general video and audio signals do not always match, and it is intended to be distributed within 0-1. This is because there is a possibility that the distribution is within a narrow range.
[0008]
An object of the present invention is to provide an appropriate normalization method in a similarity search system using a plurality of feature amounts.
[0009]
The database of the video and audio signals is originally registered as a content for some purpose. The purpose of the similarity search is to provide a means for efficiently organizing the registered contents. Therefore, in the present invention, the effective dynamic range is measured from the characteristic amount distribution of the registered signal, and the value is normalized so that the signal registered in the database is evenly distributed in the metric space as much as possible to facilitate classification. It is characterized in that it is used for conversion. Further, the present invention provides two types of techniques for performing normalization, a technique performed in a feature quantity space and a technique performed in a metric space. These techniques are selectively used depending on the device scale, calculation resources, and accuracy required by an application. Is made possible.
[0010]
[Means for Solving the Problems]
A first similarity calculation device of the present invention is a similarity calculation device for calculating a distance between a video or audio signal serving as an inquiry signal and a plurality of video or audio signals registered in advance in a database, An inquiry signal feature amount extraction unit for calculating a plurality of signal feature amounts, and a distance between each signal feature amount from the extracted signal feature amounts and a plurality of video feature amounts of individual video or audio signals registered in the database. Calculating a distance between individual signal feature values to be calculated, and statistically processing a group of distances between individual feature values between the inquiry signal output by the individual signal feature value distance calculation unit and each database registration signal for each signal feature type. The inter-feature distance distribution situation calculating section that outputs a statistic indicating the distance distribution situation for each signal feature quantity, and the individual signal inter-feature distance calculating section calculates An inter-individual signal feature distance normalizing unit for normalizing the inter-individual signal feature distance using a statistic indicating the distance distribution state; and a comprehensive inter-signal similarity based on the normalized inter-individual signal feature distance. Is obtained by calculating a similarity between signals.
[0011]
The second similarity calculation device of the present invention is the first similarity calculation device, wherein in the similarity calculation device, a statistic indicating a distance distribution state for each signal feature is a distance of an individual signal feature amount. It is characterized by comprising a minimum value and a maximum value.
[0012]
The third similarity calculation device of the present invention is the second similarity calculation device, wherein in the similarity calculation device, the inter-individual signal feature amount distance normalizing unit sets the inter-individual feature amount distance to the maximum. Normalization is performed by dividing by a difference value between the value and the minimum value.
[0013]
The fourth similarity calculation device of the present invention is the first similarity calculation device, wherein the statistic indicating the distance distribution status for each signal feature is the difference between the individual signal feature amounts. It is characterized by comprising an average value and a variance value.
[0014]
A fifth similarity calculating apparatus according to the present invention is the fourth similarity calculating apparatus, wherein the individual signal feature amount distance normalizing section calculates the average from the individual feature amount distance. Normalization is performed by subtracting a value and dividing the subtraction result by the variance.
[0015]
A sixth similarity calculating apparatus according to the present invention calculates a similarity between two video or audio signals using a plurality of signal features and a normalization index corresponding to each of the plurality of signal features. A first signal feature amount normalization unit that normalizes individual signal features of a first video or audio signal using a corresponding normalization index, and an individual signal feature of a second video or audio signal. A second signal feature normalization unit for normalizing the quantity using a corresponding normalization index, individual normalized signal features of the first video or audio signal, and a second video or audio signal An individual signal feature distance calculating unit that calculates a distance between the corresponding normalized signal feature and a signal similarity that obtains an overall signal similarity from the individual signal feature distance. It is characterized by comprising a calculating unit.
[0016]
A seventh similarity calculating apparatus according to the present invention is the sixth similarity calculating apparatus, wherein in the similarity calculating apparatus, the input normalization index is a minimum value and a maximum value of the signal feature amount. Features.
[0017]
An eighth similarity calculating apparatus according to the present invention is the seventh similarity calculating apparatus, wherein the individual signal feature quantity normalizing unit determines the individual signal feature quantity by the maximum value and the minimum value. It is characterized in that normalization is performed by dividing by a value difference value.
[0018]
A ninth similarity calculating apparatus according to the present invention is the sixth similarity calculating apparatus, wherein in the similarity calculating apparatus, the input normalization index is a variance value and an average value of the signal feature amount. Features.
[0019]
A tenth similarity calculation device according to the present invention is the ninth similarity calculation device, wherein the individual signal feature amount normalization unit subtracts the average value from the individual signal feature amount. The above is characterized in that normalization is performed by dividing the subtraction result by the variance value.
[0020]
An eleventh similarity calculating apparatus according to the present invention calculates a similarity between two video or audio signals using a plurality of signal features and a normalization index corresponding to each of the plurality of signal features. An individual signal feature distance calculation unit that calculates a distance between an individual signal feature of the first video or audio signal and a corresponding signal feature of the second video or audio signal, A normalized individual signal feature distance calculating unit that normalizes each of the calculated signal feature distances using a corresponding normalization index and calculates a normalized individual signal feature distance, and the normalized individual feature distance. It is characterized by comprising an inter-signal similarity calculating unit for obtaining a total inter-signal similarity from the inter-signal feature amount distance.
[0021]
A twelfth similarity calculating apparatus according to the present invention is the eleventh similarity calculating apparatus, wherein in the similarity calculating apparatus, the input normalization index is a minimum value and a maximum value of the signal feature amount. Features.
[0022]
A thirteenth similarity calculation device of the present invention is the twelfth similarity calculation device, wherein the individual signal feature quantity distance normalization unit sets the individual signal feature quantity distance to the maximum. Normalization is performed by dividing by a difference value between the value and the minimum value.
[0023]
A fourteenth similarity calculating apparatus according to the present invention is the eleventh similarity calculating apparatus, wherein in the similarity calculating apparatus, the input normalization index is an average value and a variance value of the signal feature amount. It is characterized in that normalization is performed.
[0024]
A fifteenth similarity calculation device of the present invention is the fourteenth similarity calculation device, wherein the individual signal feature amount distance normalizing section calculates the average from the individual signal feature amount distance. Normalization is performed by subtracting a value and dividing the subtraction result by a variance value.
[0025]
A first index data generation device of the present invention is a video or audio database index data generation device that stores a plurality of signal feature amounts of a video or audio signal. In addition to the extracted signal feature amount extraction unit, a feature amount distribution situation calculation unit that calculates the statistic amount of each individual feature amount from the extracted feature amount and the registered feature amount, It is characterized by comprising a feature amount distribution status recording unit for outputting to a voice database.
[0026]
A second index data generation device according to the present invention is characterized in that in the index data generation device, an average value and a variance value of each feature amount are used as statistics.
[0027]
A third index data generation device according to the present invention is the first index data generation device, wherein the index data generation device uses a maximum value and a minimum value of each feature amount as statistics. .
[0028]
A first video or audio database device of the present invention is a video or audio database device for storing a plurality of signal characteristic amounts of a video or audio signal, wherein a plurality of signal characteristic amount statistics extracted from the registered video signal are stored. In addition to the quantities, an index indicating the statistical property of each feature quantity is also stored.
[0029]
The second video or audio database device of the present invention is the first video or audio database device, wherein in the video or audio database device, an average value of each feature amount is used as an index indicating a statistical property of the feature amount. And a variance value.
[0030]
A third video or audio database device according to the present invention is the first video or audio database device, wherein the video or audio database device has a minimum value of each feature value as an index indicating a statistical property of the feature value. And the maximum value is used.
[0031]
A first similarity calculation method of the present invention is a similarity calculation method for calculating a distance between a video or audio signal serving as an inquiry signal and a plurality of video or audio signals registered in advance in a database, An inquiry signal feature amount extraction process of calculating a plurality of signal feature amounts, and a distance between respective signal feature amounts from the extracted signal feature amounts and a plurality of video feature amounts of individual video or audio signals registered in the database. Calculating the distance between the individual signal features to be calculated, and statistically processing the distance group between the individual features between the inquiry signal and the individual database registration signal output by the distance between individual signal features calculation unit for each signal feature type. A feature value distance distribution situation calculation step of outputting a statistic indicating a distance distribution situation for each signal feature quantity, and the individual signal feature quantity distance calculation assumption An individual signal feature distance normalization process for normalizing the calculated distance between individual signal features using a statistic indicating the distance distribution state, and a total signal interval from the normalized individual signal feature distance. It is characterized in that it comprises a process of calculating a similarity between signals for obtaining a similarity.
[0032]
A second similarity calculation method according to the present invention is the first similarity calculation method, wherein in the similarity calculation method, a statistic indicating a distance distribution state for each of the signal features is a distance between individual signal feature amounts. It is characterized by comprising a minimum value and a maximum value.
[0033]
A third similarity calculation method according to the present invention is the second similarity calculation method, wherein the individual signal feature distance separation normalizing step includes setting the individual feature distance to the maximum. Normalization is performed by dividing by a difference value between the value and the minimum value.
[0034]
A fourth similarity calculation method according to the present invention is the first similarity calculation method, wherein in the similarity calculation method, a statistic indicating a distance distribution state for each of the signal features is a distance between individual signal feature amounts. It is characterized by comprising an average value and a variance value.
[0035]
A fifth similarity calculation method according to the present invention is the fourth similarity calculation method, wherein in the similarity calculation method, the step of normalizing the distance between individual signal features is performed based on the distance between individual features. Normalization is performed by subtracting a value and dividing the subtraction result by the variance.
[0036]
A sixth similarity calculation method according to the present invention calculates a similarity between two video or audio signals using a plurality of signal features and a normalization index corresponding to each of the plurality of signal features. A first signal feature amount normalization step of normalizing individual signal features of the first video or audio signal using the corresponding normalization index, and individual signal features of the second video or audio signal. A second signal feature normalization process for normalizing the quantity using a corresponding normalization index, individual normalized signal features of the first video or audio signal, and a second video or audio signal. A distance calculation process for calculating the distance between the individual signal feature amounts corresponding to the normalized signal feature amounts corresponding thereto, and a signal similarity degree for obtaining an overall signal similarity from the distance between the individual signal feature amounts. Characterized by a calculation process
[0037]
The seventh similarity calculation method of the present invention is the sixth similarity calculation method, wherein in the similarity calculation method, the input normalization index is a minimum value and a maximum value of the signal feature amount. Features.
[0038]
An eighth similarity calculation method according to the present invention is the seventh similarity calculation method, wherein in the similarity calculation method, the individual signal feature amount normalizing step includes: setting the individual signal feature amount to the maximum value and the minimum value. It is characterized in that normalization is performed by dividing by a value difference value.
[0039]
A ninth similarity calculation method according to the present invention is the sixth similarity calculation method, wherein in the similarity calculation method, the input normalization index is a variance value and an average value of the signal feature amount. Features.
[0040]
A tenth similarity calculation method according to the present invention is the ninth similarity calculation method, wherein in the similarity calculation method, the individual signal feature quantity normalizing step is obtained by subtracting the average value from the individual signal feature quantity. The above is characterized in that normalization is performed by dividing the subtraction result by the variance value.
[0041]
An eleventh similarity calculation method according to the present invention calculates a similarity between two video or audio signals using a plurality of signal feature amounts and a normalization index corresponding to each of the plurality of signal feature amounts. An individual signal feature distance calculation step of calculating a distance between each signal feature of the first video or audio signal and a corresponding signal feature of the second video or audio signal, Normalizing each of the obtained signal feature amount distances using a corresponding normalization index to calculate a normalized individual signal feature amount distance, and the normalized individual feature distance distance process. It is characterized in that it comprises an inter-signal similarity calculating step of obtaining a total inter-signal similarity from the distance between signal feature amounts.
[0042]
A twelfth similarity calculation method according to the present invention is the eleventh similarity calculation method, wherein in the similarity calculation method, the input normalization index is a minimum value and a maximum value of the signal feature amount. Features.
[0043]
A thirteenth similarity calculation method according to the present invention is the twelfth similarity calculation method, wherein in the similarity calculation method, the distance between individual signal features is normalized by setting the distance between individual signal features to the maximum. Normalization is performed by dividing by a difference value between the value and the minimum value.
[0044]
A fourteenth similarity calculation method according to the present invention is the eleventh similarity calculation method, wherein in the similarity calculation method, the input normalization index is an average value and a variance value of the signal feature amount. Features.
[0045]
A fifteenth similarity calculation method of the present invention is the fourteenth similarity calculation method, wherein the individual signal feature distance separation normalizing step comprises calculating the average from the individual signal feature distance. Normalization is performed by subtracting a value and dividing the subtraction result by a variance value.
[0046]
According to a first index data generation method of the present invention, in the index data generation method of a video or audio database storing a plurality of signal characteristic amounts of a video or audio signal, a plurality of signal characteristic amounts are input from an input video or audio signal. In addition to the signal feature value extraction process to be extracted, a feature value distribution situation calculation process of calculating a statistic for each feature value from the extracted feature value and the registered feature value, and It is characterized by comprising a feature amount distribution status recording step of outputting to a voice database.
[0047]
A second index data generation method according to the present invention is the first index data generation method, wherein in the index data generation method, an average value and a variance value of each feature amount are used as statistics. .
[0048]
A third index data generation method according to the present invention is the first index data generation method, wherein a maximum value and a minimum value of each feature amount are used as statistics.
[0049]
A first video or audio content expression data storage device of the present invention is a video or audio signal content expression data storage device that stores a plurality of signal feature amounts of a video or audio signal. It is characterized in that in addition to the extracted plurality of signal feature amount statistics, an index indicating the statistical property of each feature amount is also included.
[0050]
The second video or audio content expression data storage device of the present invention is the first video or audio content expression data storage device, wherein the average value of each characteristic amount and the average value of each characteristic amount are used as indices indicating the statistical properties of the characteristic amounts. It is characterized by using a variance value.
[0051]
The third video or audio content expression data storage device of the present invention is the first video or audio content expression data storage device,
It is characterized in that the minimum value and the maximum value of each feature amount are used as indices indicating the statistical properties of the feature amounts.
[0052]
A recording medium according to the present invention is characterized by storing the claim similarity calculation method or the signal feature index creation method.
[0053]
BEST MODE FOR CARRYING OUT THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 shows an embodiment of a method for normalizing feature values in a metric space.
In this embodiment, a signal similarity 107 (distance) between a registration signal and an inquiry signal is output from an inquiry signal 101 and a registered signal
The signal characteristic amount extraction unit 10 extracts a plurality of types of inquiry signal characteristic amounts 102 from the inquiry signal 101. Hereinafter, the extracted N types of feature amounts are denoted by {F i : (I = 1, 2,..., N)}. As each feature, for example, a signal feature described in ISO / IEC 15938 Multimedia Content Description Interface (ISO / IEC 15938) is used. Can be. When the individual signal feature amounts are vector amounts, each of the constituent elements that are scalar amounts may be independently treated as “individual signal feature amounts”. The registered
[0054]
The inter-individual feature
[0055]
The normalized inter-characteristic distance 106, which is the result of the normalization processing, is integrated, and the signal similarity calculator 14 calculates the signal similarity 107 {D between the inquiry signal and the registered signal (inquiry signal, j-th registration signal). i : (J = 1, 2,..., M)}. In order to obtain the signal similarity 107 from the normalized inter-characteristic distance 106, various methods such as sum of absolute values and sum of squares of the individual distances can be used.
[0056]
According to the present invention, the individual feature
[0057]
FIG. 2 shows an embodiment of a method for normalizing a feature in a feature space.
In this embodiment, a registration signal and an inquiry signal are obtained from an inquiry signal 101, a registration signal
[0058]
The signal characteristic amount extraction unit 10 extracts a plurality of types of inquiry signal characteristic amounts 102 from the inquiry signal 101. In the database, in addition to the registration
[0059]
Similarly, for example, if the individual feature values have a uniform distribution, the minimum value and the maximum value are used to calculate the ith feature value / (the maximum value of the ith feature value−the minimum value of the ith feature value). Normalization can be realized.
[0060]
Since the individual feature values have already been normalized, simple distance calculation is performed by the individual feature value
[0061]
In this embodiment, before calculating the inter-individual feature amount distance 111 in the inter-individual feature
[0062]
FIG. 3 shows an embodiment of an index data generation system for constructing a database that also has a normalization index required when performing normalization in the feature space.
[0063]
This embodiment is a system that adds an index signal extracted from a new registration signal 112 to a database that already holds the registration
[0064]
The newly registered signal 112 is input to the signal feature amount extraction unit 10, and a newly registered
[0065]
【The invention's effect】
As described above, the present invention has the following effects.
[0066]
A first effect is that an appropriate relative evaluation between features having different value ranges can be performed in a search system using a plurality of signal features in combination.
[0067]
Since the normalization is performed not in a general situation but in a state optimized for the database, it is possible to more appropriately arrange the signals registered in the database.
The second effect is that by performing normalization in the feature space instead of the metric space, the process of repeating the normalization parameter calculation process for each distance calculation can be omitted, and the system scale can be reduced. It is in.
[Brief description of the drawings]
FIG. 1 is a block diagram of a configuration for performing adaptive normalization in a metric space according to an embodiment of the present invention.
FIG. 2 is a block diagram of a configuration for performing adaptive normalization processing in a feature space according to the embodiment of this invention.
FIG. 3 is a block diagram of an index data generation system according to the embodiment of the present invention.
[Explanation of symbols]
10 Signal feature extraction unit
11 Distance calculation unit between individual features
12 Distance distribution situation calculation part
13 Individual feature distance distance normalization unit
14 signal similarity calculator
15 Query individual feature normalization unit
16 Registered individual feature normalization unit
17 Feature distribution status calculator
101 Inquiry signal
102 Inquiry signal features
103 Registered signal features
104 Distance between individual features
105 Distance distribution index
106 Normalized distance between individual features
107 Signal similarity
108 Feature Normalization Index
109 Normalized interrogation signal features
110 Normalized registration signal features
111 Distance between individual features
112 New registration signal
113 Newly registered signal features
Claims (43)
前記問い合わせ信号から複数の信号特徴量を算出する問い合わせ信号特徴量抽出部と、
前記抽出した信号特徴量とデータベースに登録された個々の映像または音声信号の複数の映像特徴量からそれぞれの信号特徴量間の距離を計算する個別信号特徴量間距離算出部と、
前記個別信号特徴量間距離算出部が出力する問い合わせ信号と個々のデータベース登録信号間の個別特徴量間距離群を信号特徴量種別毎に統計処理し、信号特徴量毎の距離分布状況を示す統計量を出力する特徴量間距離分布状況計算部と、
前記個別信号特徴量間距離算出部が算出した個別信号特徴量間距離を前記距離分布状況を示す統計量を用いて正規化する個別信号特徴量間距離正規化部と、
正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする類似度計算装置。In a similarity calculation device that calculates the distance between a plurality of video or audio signals registered in advance in a database, the video or audio signal serving as an inquiry signal,
An inquiry signal characteristic amount extraction unit that calculates a plurality of signal characteristic amounts from the inquiry signal,
An individual signal feature distance calculation unit that calculates a distance between each signal feature from the plurality of video features of the individual video or audio signals registered in the extracted signal feature and the database,
Statistical processing is performed on the inter-individual feature distance group between the inquiry signal and the individual database registration signal output by the inter-individual signal feature distance calculation unit for each signal feature type, and the statistics indicating the distance distribution status for each signal feature amount A feature amount distance distribution status calculation unit for outputting a quantity,
An inter-individual signal feature amount distance normalization unit that normalizes the inter-individual signal feature amount distance calculated by the inter-individual signal feature amount calculation unit using a statistic indicating the distance distribution situation;
A similarity calculating apparatus comprising an inter-signal similarity calculating unit that obtains a total inter-signal similarity from a normalized distance between individual signal features.
前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の最小値と最大値からなることを特徴とする請求項1記載の類似度計算装置。In the similarity calculation device,
The similarity calculation apparatus according to claim 1, wherein the statistic indicating the distance distribution state for each signal feature includes a minimum value and a maximum value of the distance between individual signal features.
前記個別信号特徴量間距離正規化部が、個別特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項2記載の類似度計算装置。In the similarity calculation device,
3. The degree of similarity according to claim 2, wherein the inter-individual signal feature amount distance normalizing unit performs normalization by dividing the inter-individual feature amount distance by a difference value between the maximum value and the minimum value. Computing device.
前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の平均値と分散値からなることを特徴とする請求項1記載の類似度計算装置。In the similarity calculation device,
The similarity calculation device according to claim 1, wherein the statistic indicating the distance distribution state for each signal feature comprises an average value and a variance value of the distance between individual signal features.
前記個別信号特徴量間距離正規化部が、個別特徴量間距離から前記平均値を減算した上で減算結果を前記分散値で除算することにより正規化を実施することを特徴とする請求項4記載の類似度計算装置。In the similarity calculation device,
5. The normalization unit according to claim 4, wherein the inter-individual signal feature distance normalizing unit subtracts the average value from the inter-individual feature distance and divides the subtraction result by the variance. A similarity calculation device as described.
第一の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第一の信号特徴量正規化部と、
第二の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第二の信号特徴量正規化部と、
第一の映像または音声信号の個々の正規化された信号特徴量と、第二の映像または音声信号の対応する正規化された信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出部と、
前記個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする類似度計算装置。In a similarity calculation device that calculates a similarity between two video or audio signals using a plurality of signal feature amounts and a normalization index corresponding to each of the plurality of signal feature amounts,
A first signal feature amount normalization unit that normalizes each signal feature amount of the first video or audio signal using a corresponding normalization index,
A second signal feature amount normalization unit that normalizes an individual signal feature amount of the second video or audio signal using a corresponding normalization index,
Between individual signal features that perform distance calculations between the individual normalized signal features of the first video or audio signal and the corresponding normalized signal features of the second video or audio signal, respectively. A distance calculator,
A similarity calculation device comprising an inter-signal similarity calculation unit for obtaining a total inter-signal similarity from the distance between the individual signal feature amounts.
入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする請求項6記載の類似度計算装置。In the similarity calculation device,
7. The similarity calculating apparatus according to claim 6, wherein the input normalization index is a minimum value and a maximum value of the signal feature amount.
個別信号特徴量正規化部は、個別信号特徴量を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項7記載の類似度計算装置。In the similarity calculation device,
The similarity calculation device according to claim 7, wherein the individual signal feature amount normalization unit performs normalization by dividing the individual signal feature amount by a difference value between the maximum value and the minimum value.
入力である正規化指標が信号特徴量の分散値及び平均値であることを特徴とする請求項6記載の類似度計算装置。In the similarity calculation device,
7. The similarity calculation device according to claim 6, wherein the input normalization index is a variance value and an average value of the signal feature amount.
個別信号特徴量正規化部は、個別信号特徴量から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする請求項9記載の類似度計算装置。In the similarity calculation device,
10. The similarity calculation according to claim 9, wherein the individual signal feature quantity normalization unit performs normalization by subtracting the average value from the individual signal feature quantity and dividing the subtraction result by a variance value. apparatus.
第一の映像または音声信号の個々の信号特徴量と、第二の映像または音声信号の対応する信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出部と、
算出された前記信号特徴量間距離それぞれを対応する正規化指標を用いて正規化し正規化された個別信号特徴量間距離を計算する個別信号特徴量間距離正規化部と、
前記正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出部からなることを特徴とする類似度計算装置。In a similarity calculation device that calculates a similarity between two video or audio signals using a plurality of signal feature amounts and a normalization index corresponding to each of the plurality of signal feature amounts,
Individual signal feature amount of the first video or audio signal, and an individual signal feature amount distance calculation unit that performs a distance calculation between the corresponding signal feature amount of the second video or audio signal,
An inter-individual signal feature amount distance normalization unit that calculates a normalized inter-individual signal feature amount distance by normalizing each of the calculated inter-signal feature amount distances using a corresponding normalization index,
A similarity calculating apparatus, comprising: an inter-signal similarity calculating unit that obtains an overall inter-signal similarity from the normalized distance between individual signal features.
入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする請求項11記載の類似度計算装置。In the similarity calculation device,
12. The similarity calculation device according to claim 11, wherein the input normalization index is a minimum value and a maximum value of the signal feature amount.
個別信号特徴量間距離正規化部は、個別信号特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項12記載の類似度計算装置。In the similarity calculation device,
13. The similarity according to claim 12, wherein the inter-individual signal feature distance normalization unit performs normalization by dividing the inter-individual signal feature distance by a difference value between the maximum value and the minimum value. Computing device.
入力である正規化指標が信号特徴量の平均値及び分散値であることにより正規化を実施することを特徴とする請求項11記載の類似度計算装置。In the similarity calculation device,
12. The similarity calculating apparatus according to claim 11, wherein the normalization is performed based on an average value and a variance value of the signal feature amount, which are input as the normalization index.
個別信号特徴量間距離正規化部は、個別信号特徴量間距離から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする請求項14記載の類似度計算装置。In the similarity calculation device,
15. The inter-individual-signal-feature-value-distance normalizing unit performs normalization by subtracting the average value from the inter-individual-signal-feature-value distance, and dividing the subtraction result by a variance value. Similarity calculator.
入力される映像または音声信号から複数の信号特徴量を抽出する信号特徴量抽出部に加えて、
抽出された特徴量と登録済みの特徴量から、個々の特徴量それぞれについてその統計量を算出する特徴量分布状況算出部と、
前記統計量を映像または音声データベースに出力する特徴量分布状況記録部からなることを特徴とするインデックスデータ生成装置。In a video or audio database index data generation device that stores a plurality of signal features of the video or audio signal,
In addition to the signal feature amount extraction unit that extracts a plurality of signal feature amounts from the input video or audio signal,
A feature amount distribution status calculation unit that calculates a statistic of each of the feature amounts from the extracted feature amounts and the registered feature amounts;
An index data generation device, comprising: a feature amount distribution status recording unit that outputs the statistics to a video or audio database.
統計量としてそれぞれの特徴量の平均値および分散値を用いることを特徴とするインデックスデータ生成装置。In the index data generation device,
An index data generation device characterized by using an average value and a variance value of each feature amount as a statistic.
統計量としてそれぞれの特徴量の最大値および最小値を用いることを特徴とする請求項16記載のインデックスデータ生成装置。In the index data generation device,
17. The index data generation device according to claim 16, wherein a maximum value and a minimum value of each feature amount are used as the statistics.
登録されているここの映像信号から抽出した複数の信号特徴量統計量に加えて、それぞれの特徴量の統計的性質をあらわす指標をも格納することを特徴とする映像または音声データベース装置。In a video or audio database device that stores a plurality of signal features of a video or audio signal,
A video or audio database apparatus, which stores, in addition to a plurality of signal feature quantity statistics extracted from the registered video signal, an index indicating a statistical property of each feature quantity.
特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の平均値及び分散値を用いることを特徴とする請求項19記載の映像または音声データベース装置。In a video or audio database device,
20. The video or audio database apparatus according to claim 19, wherein an average value and a variance value of each of the feature amounts are used as indices indicating the statistical properties of the feature amounts.
特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の最小値および最大値を用いることを特徴とする請求項19記載の映像または音声データベース装置。In a video or audio database device,
20. The video or audio database device according to claim 19, wherein a minimum value and a maximum value of each feature amount are used as indices indicating the statistical properties of the feature amounts.
前記問い合わせ信号から複数の信号特徴量を算出する問い合わせ信号特徴量抽出過程と、
前記抽出した信号特徴量とデータベースに登録された個々の映像または音声信号の複数の映像特徴量からそれぞれの信号特徴量間の距離を計算する個別信号特徴量間距離算出過程と、
前記個別信号特徴量間距離算出部が出力する問い合わせ信号と個々のデータベース登録信号間の個別特徴量間距離群を信号特徴量種別毎に統計処理し、信号特徴量毎の距離分布状況を示す統計量を出力する特徴量間距離分布状況計算過程と、前記個別信号特徴量間距離算出仮定で算出した個別信号特徴量間距離を前記距離分布状況を示す統計量を用いて正規化する個別信号特徴量間距離正規化過程と、正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする類似度計算方法。In a similarity calculation method for calculating the distance between a plurality of video or audio signals registered in advance in a database, the video or audio signal serving as an inquiry signal,
An inquiry signal feature amount extraction step of calculating a plurality of signal feature amounts from the inquiry signal,
An individual signal feature distance calculating step of calculating a distance between respective signal features from a plurality of video features of the individual video or audio signals registered in the extracted signal feature and the database,
Statistical processing is performed on the inter-individual feature distance group between the inquiry signal and the individual database registration signal output by the inter-individual signal feature distance calculation unit for each signal feature type, and the statistics indicating the distance distribution status for each signal feature amount And calculating the distance between the individual signal features, which calculates the distance between the individual signal features by using the statistic indicating the distance distribution status. A similarity calculation method characterized by comprising an inter-quantity distance normalization step and an inter-signal similarity calculation step of obtaining a comprehensive inter-signal similarity from the normalized individual signal feature amount distance.
前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の最小値と最大値からなることを特徴とする請求項22記載の類似度計算方法。In the similarity calculation method,
23. The similarity calculation method according to claim 22, wherein the statistic indicating the distance distribution state for each signal feature includes a minimum value and a maximum value of the distance between individual signal features.
前記個別信号特徴量間距離正規化過程が、個別特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項23記載の類似度計算方法。In the similarity calculation method,
24. The degree of similarity according to claim 23, wherein the normalizing step between individual signal features performs normalization by dividing the distance between individual features by a difference value between the maximum value and the minimum value. Method of calculation.
前記信号特徴毎の距離分布状況を示す統計量が個別信号特徴量間距離の平均値と分散値からなることを特徴とする請求項22記載の類似度計算方法。In the similarity calculation method,
23. The similarity calculation method according to claim 22, wherein the statistic indicating the distance distribution state for each signal feature comprises an average value and a variance of the distance between individual signal features.
前記個別信号特徴量間距離正規化過程が、個別特徴量間距離から前記平均値を減算した上で減算結果を前記分散値で除算することにより正規化を実施することを特徴とする請求項25記載の類似度計算方法。In the similarity calculation method,
26. The inter-individual signal feature distance normalization step performs normalization by subtracting the average value from the inter-individual feature distance and dividing the result of the subtraction by the variance. The similarity calculation method described.
第一の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第一の信号特徴量正規化過程と、
第二の映像または音声信号の個々の信号特徴量を対応する正規化指標を用いて正規化する第二の信号特徴量正規化過程と、
第一の映像または音声信号の個々の正規化された信号特徴量と、第二の映像または音声信号の対応する正規化された信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出過程と、
前記個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする類似度計算方法。In a similarity calculation method of calculating a similarity between two video or audio signals using a plurality of signal feature amounts and a normalization index corresponding to each of the plurality of signal feature amounts,
A first signal feature amount normalization step of normalizing individual signal features of the first video or audio signal using a corresponding normalization index,
A second signal feature amount normalization process of normalizing the individual signal feature amount of the second video or audio signal using a corresponding normalization index,
Between individual signal features that perform distance calculations between the individual normalized signal features of the first video or audio signal and the corresponding normalized signal features of the second video or audio signal, respectively. Distance calculation process,
A similarity calculation method characterized by comprising an inter-signal similarity calculation step of obtaining a total inter-signal similarity from the individual signal feature distance.
入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする請求項27記載の類似度計算方法。In the similarity calculation method,
28. The similarity calculation method according to claim 27, wherein the input normalization index is a minimum value and a maximum value of the signal feature amount.
個別信号特徴量正規化過程は、個別信号特徴量を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項28記載の類似度計算方法。In the similarity calculation method,
29. The similarity calculation method according to claim 28, wherein in the individual signal feature amount normalization step, normalization is performed by dividing the individual signal feature amount by a difference value between the maximum value and the minimum value.
入力である正規化指標が信号特徴量の分散値及び平均値であることを特徴とする請求項27記載の類似度計算方法。In the similarity calculation method,
28. The similarity calculation method according to claim 27, wherein the input normalization index is a variance value and an average value of the signal feature amount.
個別信号特徴量正規化過程は、個別信号特徴量から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする請求項30記載の類似度計算方法。In the similarity calculation method,
31. The similarity calculation according to claim 30, wherein in the individual signal feature amount normalization process, the normalization is performed by subtracting the average value from the individual signal feature amount and dividing the subtraction result by a variance value. Method.
第一の映像または音声信号の個々の信号特徴量と、第二の映像または音声信号の対応する信号特徴量との間でそれぞれ距離計算を行う個別信号特徴量間距離算出過程と、
算出された前記信号特徴量間距離それぞれを対応する正規化指標を用いて正規化し正規化された個別信号特徴量間距離を計算する個別信号特徴量間距離正規化過程と、
前記正規化された個別信号特徴量間距離から総合的な信号間類似度を求める信号間類似度算出過程からなることを特徴とする類似度計算方法。In a similarity calculation method of calculating a similarity between two video or audio signals using a plurality of signal feature amounts and a normalization index corresponding to each of the plurality of signal feature amounts,
Individual signal feature amount of the first video or audio signal, and individual signal feature amount distance calculation step of performing a distance calculation between the corresponding signal feature amount of the second video or audio signal,
An individual signal feature amount distance normalization process of calculating the normalized individual signal feature amount distance by normalizing each of the calculated signal feature amount distances with a corresponding normalization index,
A similarity calculation method characterized by comprising an inter-signal similarity calculation step of obtaining a total inter-signal similarity from the normalized distance between individual signal features.
入力である正規化指標が信号特徴量の最小値及び最大値であることを特徴とする請求項32記載の類似度計算方法。In the similarity calculation method,
33. The similarity calculation method according to claim 32, wherein the input normalization index is a minimum value and a maximum value of the signal feature amount.
個別信号特徴量間距離正規化過程は、個別信号特徴量間距離を前記最大値と前記最小値の差分値で除算することにより正規化を実施することを特徴とする請求項33記載の類似度計算方法。In the similarity calculation method,
34. The degree of similarity according to claim 33, wherein the normalizing step between the individual signal feature amounts performs the normalization by dividing the distance between the individual signal feature amounts by a difference value between the maximum value and the minimum value. Method of calculation.
入力である正規化指標が信号特徴量の平均値及び分散値であることを特徴とする請求項32記載の類似度計算方法。In the similarity calculation method,
33. The similarity calculation method according to claim 32, wherein the input normalization index is an average value and a variance value of the signal feature amount.
個別信号特徴量間距離正規化過程は、個別信号特徴量間距離から前記平均値を減算した上で減算結果を分散値で除算することにより正規化を実施することを特徴とする請求項35記載の類似度計算方法。In the similarity calculation method,
36. The normalization process of the distance between individual signal features, wherein the normalization is performed by subtracting the average value from the distance between the individual signal features and dividing the subtraction result by a variance value. Similarity calculation method.
入力される映像または音声信号から複数の信号特徴量を抽出する信号特徴量抽出過程に加えて、
抽出された特徴量と登録済みの特徴量から、個々の特徴量それぞれについてその統計量を算出する特徴量分布状況算出過程と、
前記統計量を映像または音声データベースに出力する特徴量分布状況記録過程からなることを特徴とするインデックスデータ生成方法。In the method of generating index data of a video or audio database that stores a plurality of signal features of a video or audio signal,
In addition to the signal feature extraction process of extracting a plurality of signal features from the input video or audio signal,
A feature amount distribution situation calculation process of calculating a statistic of each of the individual feature amounts from the extracted feature amounts and the registered feature amounts;
A method for generating index data, comprising a feature amount distribution status recording step of outputting the statistics to a video or audio database.
統計量としてそれぞれの特徴量の平均値および分散値を用いることを特徴とする請求項37記載のインデックスデータ生成方法。In the index data generation method,
38. The index data generation method according to claim 37, wherein an average value and a variance value of each feature amount are used as the statistic.
統計量としてそれぞれの特徴量の最大値および最小値を用いることを特徴とする請求項38記載のインデックスデータ生成方法。In the index data generation device,
39. The index data generation method according to claim 38, wherein a maximum value and a minimum value of each feature amount are used as the statistics.
登録されているここの映像信号から抽出した複数の信号特徴量統計量に加えて、それぞれの特徴量の統計的性質をあらわす指標もが含まれることを特徴とする映像または音声内容表現データ記憶装置。In a video or audio signal content representation data storage device that stores a plurality of signal feature amounts of the video or audio signal,
A video or audio content expression data storage device characterized in that, in addition to a plurality of signal feature amount statistics extracted from the registered video signal, an index indicating a statistical property of each feature amount is included. .
特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の平均値及び分散値を用いることを特徴とする請求項40記載の内容表現データ記憶装置。In the content expression data storage device,
41. The content expression data storage device according to claim 40, wherein an average value and a variance value of each feature amount are used as indices indicating the statistical properties of the feature amounts.
特徴量の統計的性質をあらわす指標としてそれぞれの特徴量の最小値および最大値を用いることを特徴とする請求項40記載の内容表現データ記憶装置。In the content expression data storage device,
41. The content expression data storage device according to claim 40, wherein the minimum value and the maximum value of each feature amount are used as indices indicating the statistical properties of the feature amounts.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002162957A JP2004013306A (en) | 2002-06-04 | 2002-06-04 | Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002162957A JP2004013306A (en) | 2002-06-04 | 2002-06-04 | Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004013306A true JP2004013306A (en) | 2004-01-15 |
Family
ID=30431553
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002162957A Withdrawn JP2004013306A (en) | 2002-06-04 | 2002-06-04 | Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004013306A (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006072763A (en) * | 2004-09-02 | 2006-03-16 | Hiroshima Univ | Image processing apparatus, image processing integrated circuit, image processing method, image processing program, and computer-readable recording medium |
| JP2007240589A (en) * | 2006-03-06 | 2007-09-20 | Nippon Telegr & Teleph Corp <Ntt> | Speech recognition reliability estimation apparatus, method thereof, and program |
| JP2016001387A (en) * | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | Image classification preprocessing device, image classification device, image classification preprocessing method, image classification method, and program |
| US9235777B2 (en) | 2013-08-12 | 2016-01-12 | Apollo Japan Co., Ltd. | Code conversion device for image information, a code conversion method for the image information, a system for providing image related information using an image, and a non-transitory computer readable medium for the image information |
-
2002
- 2002-06-04 JP JP2002162957A patent/JP2004013306A/en not_active Withdrawn
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006072763A (en) * | 2004-09-02 | 2006-03-16 | Hiroshima Univ | Image processing apparatus, image processing integrated circuit, image processing method, image processing program, and computer-readable recording medium |
| JP2007240589A (en) * | 2006-03-06 | 2007-09-20 | Nippon Telegr & Teleph Corp <Ntt> | Speech recognition reliability estimation apparatus, method thereof, and program |
| US9235777B2 (en) | 2013-08-12 | 2016-01-12 | Apollo Japan Co., Ltd. | Code conversion device for image information, a code conversion method for the image information, a system for providing image related information using an image, and a non-transitory computer readable medium for the image information |
| JP2016001387A (en) * | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | Image classification preprocessing device, image classification device, image classification preprocessing method, image classification method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102251302B1 (en) | Collaborative filtering method, device, server and storage media combined with time factor | |
| CN113420097B (en) | Data analysis method, device, storage medium and server | |
| JPWO2010053160A1 (en) | Content search apparatus and content search program | |
| CN103793447B (en) | Method and system for estimating semantic similarity between music and images | |
| CN111047410B (en) | Recommended methods, devices, terminal equipment and storage media | |
| CN111159563A (en) | Method, device and equipment for determining user interest point information and storage medium | |
| Arifin et al. | A computation method for video segmentation utilizing the pleasure-arousal-dominance emotional information | |
| CN113254804A (en) | Social relationship recommendation method and system based on user attributes and behavior characteristics | |
| CN111538909A (en) | Information recommendation method and device | |
| CN111814846A (en) | Training method and recognition method of attribute recognition model and related equipment | |
| JP2018081169A (en) | Speaker attribute estimation system, learning device, estimation device, speaker attribute estimation method, and program | |
| CN120671191B (en) | Privacy computing method and system based on cross-modal data fusion | |
| JP2004013306A (en) | Similarity computing device, index data generating device, video or audio database device, similarity computing method, index data generating method, content representation data storage device, and recording medium | |
| CN119379403B (en) | A method, system and medium for screening target users | |
| CN112650869B (en) | Image retrieval reordering method and device, electronic equipment and storage medium | |
| CN114003691A (en) | Standardized representation method, device, equipment and storage medium of entity name | |
| CN112085522B (en) | Construction cost data processing method, system, device and medium for engineering project | |
| CN118734947B (en) | Knowledge graph completion method and device based on attention penalty and noise sampling | |
| Jing et al. | Polynomial histograms for multivariate density and mode estimation | |
| CN114764594B (en) | Classification model feature selection method, device and equipment | |
| CN114529136B (en) | Electronic component evaluation method and device based on principal component analysis and Topsis | |
| CN117390470A (en) | Unsupervised community detection methods, devices, equipment and media based on heterogeneous networks | |
| CN109190013A (en) | User preference determination method, system, readable storage medium and electronic device | |
| CN113722440B (en) | Significance analysis method based on keyword recognition and related products | |
| CN113627681A (en) | Data prediction method and device based on prediction model, computer equipment and medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050906 |