JPWO1994007239A1 - Audio encoding method and device - Google Patents
Audio encoding method and deviceInfo
- Publication number
- JPWO1994007239A1 JPWO1994007239A1 JP6-507969A JP50796994A JPWO1994007239A1 JP WO1994007239 A1 JPWO1994007239 A1 JP WO1994007239A1 JP 50796994 A JP50796994 A JP 50796994A JP WO1994007239 A1 JPWO1994007239 A1 JP WO1994007239A1
- Authority
- JP
- Japan
- Prior art keywords
- code
- vector
- vectors
- correlation
- code vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Abstract] This publication contains application data prior to electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】 音声符号化方法及び装置 技術分野 本発明は音声信号の情報圧縮を行うための音声符号化方法及び装置に関し、特に 4〜16Kbpsの伝送速度で符号化を行うためのAnalysisby−3y nthesis (A −b S )形ベクトル量子化を用いた音声符号化方法 及び装置に関する。[Detailed Description of the Invention] Audio Coding Method and Apparatus Technical Field The present invention relates to an audio coding method and apparatus for compressing audio signal information, and more particularly to an audio coding method and apparatus using analysis-by-three-dimensional (A-b-S) vector quantization for encoding at transmission rates of 4 to 16 Kbps.
背景技術 A−b−5形ベクトル量子化を用いる音声符号器、例えばCode−Excit ed Linear Prediction (CELP)符号器は、近年、企 業内通信システム、ディジタル移動無線システムなどにおいて、音声信号をその 品質を保持しつつ情報圧縮する音声符号器として有望視されている。このベクト ル量子化音声符号器(以下、単に符号器)においては、符号帳(コードブック) の各コードベクトルに予測重み付けを施して再生信号を作り、再生信号と入力音 声信号との間の誤差電力を評価して最も誤差の少ないコードベクトルの番号(イ ンデックス)を決定して受信側に送信するものである。BACKGROUND ART Speech coders using A-b-5 vector quantization, such as Code-Excited Linear Prediction (CELP) coders, have recently been seen as promising speech coders for compressing speech signals while maintaining their quality in corporate communication systems, digital mobile radio systems, and other applications. These vector quantization speech coders (hereafter simply referred to as coders) apply predictive weighting to each code vector in a codebook to create a reproduced signal, evaluate the error power between the reproduced signal and the input speech signal, and determine the index of the code vector with the least error, which is then transmitted to the receiver.
上記のA−b−3形ベクトル量子化方式による符号器は、前記符号帳に格納され た約1000パターンの音源信号のベクトルの1つ1つに対して、線形予測合成 フィルタ処理を施し、再生された各音声信号と、符号化すべき入力音声信号との 間の誤差が最も小さくなる1つのパターンをその約1000のパターンの中から 探索するという処理を行う。The A-b-3 vector quantization encoder performs a linear predictive synthesis filter process on each of the approximately 1,000 sound source signal vector patterns stored in the codebook, and then searches among those approximately 1,000 patterns for the pattern that minimizes the error between each reproduced sound signal and the input sound signal to be encoded.
ところで符号器は通話の即時性が要求されるので、上記の探索処理をリアルタイ ムで行う必要がある。そうすると、その探索処理を行うのに、例えば5msとい う短い時間間隔で、通話の間連続して行わなければならない。However, since the encoder is required to respond to calls immediately, the above search process must be performed in real time. This means that the search process must be performed continuously throughout the call, at short intervals of, for example, 5 ms.
しかしながら後述する如く、この探索処理の中にフィルタ演算や相関演算という 複雑な演算操作が含まれていて、これらの演算操作に要する演算量は、例えば数 100Mops (メガオペシー93フフ秒)という膨大なものになる。これに 対応するには、現在、最高速とされるDigital Signal Proc essor (DSP)をもってしても、数チップを必要とし、例えば携帯電話 に適用しようとする場合、その小形化ならびに低消費電力化が困難になるという 問題がある。However, as will be explained later, this search process involves complex calculations such as filter and correlation operations, and the amount of computation required for these operations can be enormous, reaching several hundred Mops (Mop. 93 fps). Even with the fastest digital signal processors (DSPs) currently available, several chips are required to handle this, which poses challenges in miniaturization and low power consumption when applied to mobile phones, for example.
上記の問題を解決する音声符号化方式として、本願出願人は、特願平3−127 669号(特開平4−352200号公報)において、従来のように符号ベクト ルそのものを格納する代わりに信号ベクトルの差分であるデルタベクトルを格納 した符号帳を用い、それらデルタベクトルを順次加算及び減算することによって 木構造を有する符号ベクトルを生成する木構造デルタ符号帳を用いることを提案 した。As a speech coding method that solves the above problems, the applicant proposed in Japanese Patent Application No. 3-127669 (JP Patent Publication No. 4-352200) a tree-structured delta codebook. This codebook stores delta vectors, which are the differences between signal vectors, instead of storing the code vectors themselves as in the conventional method. The codebook then generates tree-structured code vectors by sequentially adding and subtracting these delta vectors.
この方式によれば、符号帳に要するメモリ容量が大幅に削減されるとともに、各 符号ベクトルに対する前記フィルタ演算及び相関演算は、デルタベクトルに対し てフィルタ演算及び相関演算を行い、その結果を順次加算及び減算することによ って達成されるので、演算量の大幅な削減が実現される。This method significantly reduces the memory capacity required for the codebook, and also significantly reduces the amount of computation required, since the filter and correlation operations for each code vector are performed by performing filter and correlation operations on the delta vector and then sequentially adding and subtracting the results.
しかし、この方式においては、各符号ベクトルがそれより少ない数の基底ベクト ルとしてのデルタベクトルの線形結合として生成されているため、その成分とし てデルタベクトル以外の成分は持たない。即ち符号化対象のベクトルが分布する 空間(通常、40〜64次元)のうち、高々デルタベクトルの数(通常、8〜1 0本)に対応する次元分の部分空間にしか符号ベクトルの分布を与えられない。However, in this method, each code vector is generated as a linear combination of a smaller number of basis vectors, i.e., delta vectors, and therefore contain no components other than the delta vectors. In other words, the code vectors can only be distributed in a subspace with dimensions corresponding to the number of delta vectors (usually 8-10) within the space in which the vectors to be encoded are distributed (usually 40-64 dimensions).
そのため、木構造デルタ符号帳では、符号化対象である音声信号の統計的分布に 基づき充分に基底ベクトル(デルタベクトル)を設計したとしても、従来の構造 上の制約の無い符号帳に比べて量子化特性が劣化するという問題があった。Therefore, even if the basis vectors (delta vectors) are designed based on the statistical distribution of the speech signal to be coded, the tree-structured delta codebook suffers from the problem of degraded quantization characteristics compared to conventional codebooks without structural constraints.
そこで本願出願人は、特願平3−515016号において、距離を評価するため に符号ベクトルに前記の線形予測合成フィルタ演算を施すとすべてのデルタベク トル成分に対して均等に増幅されず成る偏りをもって増幅されること、及び木構 造デルタ符号帳において各デルタベクトルが符号ベクトルへ与える寄与はデルタ ベクトルの順番を変えれば変えることができること、に着目し、線形予測合成フ ィルタの係数が決定される毎に各デルタベクトルC:フィルタ演算を施してパワ ー(ベクトルの長さ)を比較し、パワーの大きいデルタベクトルから順に並べ変 えを行った木構造デルタ符号帳を用いて符号化を行うことにより、特性を改善す ることを提案した。Therefore, in Japanese Patent Application No. 3-515016, the applicant of the present application noted that when the above-mentioned linear predictive synthesis filter operation is performed on a code vector to evaluate distance, all delta vector components are amplified unevenly rather than uniformly, and that the contribution of each delta vector to a code vector in a tree-structured delta codebook can be changed by changing the order of the delta vectors. Therefore, the applicant proposed a method for improving performance by performing a filter operation on each delta vector C each time the coefficients of the linear predictive synthesis filter are determined, comparing the power (vector length), and then sorting the delta vectors in descending order of power before encoding using a tree-structured delta codebook.
しかしながら、この方法によっても限られた数のデルタベクトルのみから符号ベ クトルを生成する点において従来の方法と変わりがないので、特性の改善に限界 があり、更なる改善が要望されている。However, this method is no different from the conventional method in that it generates code vectors from only a limited number of delta vectors, so there is a limit to the improvement in performance, and further improvement is desired.
A−b−5形ベクトル量子化を用いる音声符号化器のもう1つのyA題は、可変 ビットレート符号化を実現することである。可変ビットレート符号化とは、伝送 路の余裕度、音源の重要性等の状況に応して符号のビットレートを適宜変更する ことによって全体として効率の良い符号化を達成するため、ビットレートを変更 することのできる符号化方式である。Another challenge for speech coders using A-b-5 vector quantization is the realization of variable bit-rate coding. Variable bit-rate coding is a coding method that allows the bit rate to be changed appropriately depending on the transmission channel availability, the importance of the sound source, and other conditions, thereby achieving overall coding efficiency.
ベクトル量子化方式を可変レート音声符号化に用いようとした場合、個々の伝送 レートに応し1こパターン数の符号帳を用意し、それらを所望の伝送レートに応 して切り換えながら符号化を行う必要がある。When vector quantization is used for variable-rate speech coding, it is necessary to prepare a codebook with a number of patterns for each transmission rate and to switch between them according to the desired transmission rate.
この時、符号ベクトルを単に並べただけの従来の符号帳の場合、各符号帳の保持 に(ベクトルの次元二N)と(パターンfi:M)の積に相当するNXMワード のメモリが必要である。ここで、パターン数Mは、符号ベクトルのインデックス のビット数の2の巾乗に比例するので、伝送レートの可変幅を大きくしたり、伝 送レートを細かな“きざみ”で制御するには、膨大なメモリを要するという問題 がある。In this case, in the case of a conventional codebook that simply lists code vectors, storing each codebook requires NX × M words of memory, which corresponds to the product of (vector dimension 2N) and (patterns fi:M). Here, the number of patterns M is proportional to a power of 2 of the number of bits in the code vector index, so increasing the variable range of the transmission rate or controlling the transmission rate in fine increments poses the problem of requiring a huge amount of memory.
また、可変レート伝送においては、符号化後の伝送信号に対して伝送網側からの 要求で強制的に伝送レートを低く抑える必要が生じることがあり、このような場 合、復号器では符号器が生成した符号化情報に対しピントの欠落した(ビット・ ドロップ)情報から、音声信号を再生せざるをえなくなる。Furthermore, in variable-rate transmission, the transmission rate of the encoded signal may need to be reduced at the request of the transmission network. In such cases, the decoder must reconstruct the audio signal from the bit-dropped information generated by the encoder.
従来、ベクトル量子化に比べ効率の低いスカラー量子化においては、ピント・ド ロップに対する対策として、重要度の低いLSBから順にピントを落とすよう制 御したり、高レートの量子化器が低レートの量子化器の量子化レベルを包含する よう構成する(エンベデッド符号化)等の工夫がなされてきた。Scalar quantization, which is less efficient than vector quantization, has traditionally dealt with focus drop by controlling the focus to drop starting with the least significant bit (LSB) or by configuring a high-rate quantizer to encompass the quantization levels of a low-rate quantizer (embedded coding).
ところが、符号ベクトルを単に並べただけの従来の符号帳を用いるベクトル量子 化方式の場合、符号帳自体に何らの構造化もなされていないため、符号ベクトル のインデックスのビット間に重要度の差がなく (LSBが落とされてもMSB が落とされても全く異なるベクトルが呼び出されることに変わりはない)、スカ ラー量子化の場合と同様な対策が採れず、ビット ドロップに対して大きな音質 劣化を引き起こすという問題がある。However, in the case of vector quantization, which uses a conventional codebook that simply lists code vectors, the codebook itself is not structured in any way, so there is no difference in the importance of the bits in the code vector index (dropping the LSB or MSB results in a completely different vector being called). This means that the same countermeasures as those used in scalar quantization cannot be applied, resulting in significant degradation of sound quality due to bit dropping.
発明の開示 したがって本発明の第1の目的::、前述の方式よりもさらに改善された木構造 データ符号帳による音声符号化方法および装置を提供することにある。DISCLOSURE OF THE INVENTION It is therefore a first object of the present invention to provide a method and apparatus for speech coding using a tree-structured data codebook that is an improvement over the previously described methods.
本発明の第2の目的は、符号帳のために膨大なメモリを必要とせず、ビ、トドロ ソブに対する対策が可能なベクトル量子化による音声符号化方法及び装置を提供 することにある。A second object of the present invention is to provide a speech coding method and apparatus using vector quantization that does not require a large amount of memory for a codebook and that can deal with bit and digital artifacts.
本発明によれば、予め与えられた符号ベクトルの中で入力音声信号ベクトルとの 距離が最小である符号ベクトルに付されたインデックスにより該入力音声信号ベ クトルを符号化する音声符号化方法であって、 a)複数の差分符号ベクトルを格納し、b)咳差分符号ベクトルの各々に線形予 測合成フィルタのマトリクスを乗し、 C)該マトリクスが乗じられた差分符号ベクトルのパワーの増幅率を評価し、 d)該評価されたパワーの増幅率の大きさの順に該マトリクスが乗しられた差分 符号ベクトルを並べ替え、e)並べ替えられたベクトルの中から評価されたパワ ーの増幅率の大きさの順に所定個数のベクトルを選択し、f)該選択されたベク トルを木構造上で順次加算及び減算することによって生成されるべき、線形予測 合成フィルタ処理が施された符号ベクトルと、前記入力音声信号ベクトルとの距 離を評価し、g)!評価された距離が最小である符号ベクトルを決定する各段階 を具備する音声符号化方法が提供される。According to the present invention, there is provided a speech coding method for encoding an input speech signal vector using an index assigned to a code vector having a minimum distance from the input speech signal vector among predetermined code vectors, the speech coding method comprising the steps of: (a) storing a plurality of differential code vectors; (b) multiplying each differential code vector by a linear prediction synthesis filter matrix; (c) evaluating the power amplification factors of the differential code vectors multiplied by the matrix; (d) sorting the differential code vectors multiplied by the matrix in order of the magnitude of the evaluated power amplification factors; (e) selecting a predetermined number of vectors from the sorted vectors in order of the magnitude of the evaluated power amplification factors; (f) evaluating the distance between the input speech signal vector and a linear prediction synthesis filter-processed code vector to be generated by sequentially adding and subtracting the selected vectors in a tree structure; and (g) determining the code vector having the minimum evaluated distance.
本発明によれば、予め与えられた符号ベクトルの中で入力音声信号ベクトルとの 距離が最小である符号ベクトルに付されたインデックスにより咳入力音声信号ベ クトルを符号化する符号化装置であって、 複数の差分符号ベクトルを格納する手段と、該差分符号ベクトルの各々に線形予 測合成フィルタのマトリクスを乗しる手段と、 咳マトリクスが乗しられた差分符号ベクトルのパワーの増幅率を評価する手段と 、 該評価されたパワーの増幅率の大きさの順に該マトリクスが乗じられた差分符号 ベクトルを並べ替える手段と、並べ替えられたベクトルの中から評価されたパワ ーの増幅率の大きさの順に所定個数のベクトルを選択する手段と、該選択された ベクトルを木構造上で順次加算及び減算することによって生成されるべき、線形 予測合成フィルタ処理が施された符号ベクトルと、前記入力音声信号ベクトルと の距離を評価する手段と、該評価された距離が最小である符号ベクトルを決定す る手段とを具備する音声符号化装置もまた提供される。The present invention also provides a speech coding device for encoding a cough input speech signal vector using an index assigned to a code vector among predefined code vectors that has the smallest distance from the input speech signal vector, the device comprising: means for storing a plurality of differential code vectors; means for multiplying each differential code vector by a linear predictive synthesis filter matrix; means for evaluating the power amplification factors of the differential code vectors multiplied by the cough matrix; means for sorting the differential code vectors multiplied by the matrix in order of the magnitude of the evaluated power amplification factors; means for selecting a predetermined number of vectors from the sorted vectors in order of the magnitude of the evaluated power amplification factors; means for evaluating the distance between the input speech signal vector and a linear predictive synthesis filter-processed code vector to be generated by sequentially adding and subtracting the selected vectors in a tree structure; and means for determining the code vector with the smallest evaluated distance.
本発明によれば、予め与えられた符号ベクトルの中で入力音声信号ベクトルとの 距離が最小である符号ベクトルに付された可変ビット長の符号により該入力音声 信号ベクトルを可変長符号化する可変長音声符号化方法であって、 a)?X数の差分符号ベクトルを格納し、b)先頭から所望の符号ビット長に応 した数の差分符号ベクトルを木構造上で順次加算及び滅夏することによって生成 されるべき符号ベクトルと前記入力音声信号ベクトルとの距離を評価し、c)該 評価された距離が最小である符号ベクトルを決定し、d)該決定された符号ベク トルに付されるべき所望符号ビット長の符号を決定する各段階を具備する可変長 音声符号化方法もまた提供される。The present invention also provides a variable-length speech coding method for variable-length coding an input speech signal vector using a variable-bit-length code assigned to a code vector among predefined code vectors that has the smallest distance from the input speech signal vector, the variable-length speech coding method comprising the steps of: (a) storing ≠X number of differential code vectors; (b) evaluating the distance between the input speech signal vector and a code vector to be generated by sequentially adding and subtracting, from the beginning, a number of differential code vectors corresponding to a desired code bit length in a tree structure; (c) determining the code vector with the smallest evaluated distance; and (d) determining a code of the desired code bit length to be assigned to the determined code vector.
本発明によれば、予め与えられた符号ベクトルの中で入力音声信号ベクトルとの 距離が最小である符号ベクトルに付された可変ビット長の符号により咳入力音声 信号ベクトルを可変長符号化する可変長音声符号化方法であって、 複数の差分符号ベクトルを格納する手段と、先頭から所望の符号ビット長に応し た数の差分符号ベクトルを木構造上で順次加算及び減算することによって生成さ れるべき符号ベクトルと前記入力音声信号ベクトルとの距離を評価する手段と、 該評価された距離が最小である符号ベクトルを決定する手段と、該決定された符 号ベクトルに付されるべき所望符号ビット長の符号を決定する手段とを具備する 可変長音声符号化装置もまた提供される。The present invention also provides a variable-length speech coding method for variable-length coding an input cough speech signal vector using a variable-bit-length code assigned to a code vector among predefined code vectors that has the smallest distance from the input speech signal vector. The variable-length speech coding device includes: means for storing multiple differential code vectors; means for evaluating the distance between the input speech signal vector and a code vector to be generated by sequentially adding and subtracting, from the beginning, a number of differential code vectors corresponding to a desired code bit length in a tree structure; means for determining the code vector with the smallest evaluated distance; and means for determining a code of the desired code bit length to be assigned to the determined code vector.
図面の簡単な説明 図11ま音声生成系の概念を示したブロック図;図2は一般的なCELP音声符 号化の原理を示したブロック図;図3は従来技術として、A−b−3型ベクトル 量子化の雑音符号帳探索処理の構成を示したブロック図:図4は雑音符号帳探索 処理のアルゴリズムをモデル化したブロック図。Brief Description of the Drawings Figure 11 is a block diagram showing the concept of a speech generation system; Figure 2 is a block diagram illustrating the principles of general CELP speech coding; Figure 3 is a block diagram showing the configuration of the noise codebook search process for A-b-3 type vector quantization as prior art; Figure 4 is a block diagram modeling the noise codebook search process algorithm.
図5はデルタ符号帳の原理を説明するためのブロック図;図6A及び6B;=木 構造デルタ符号帳の適応化方式を説明するための図; 図?A、τB及びτCは本発明の詳細な説明するための図;図8:=本発明の音 声符号化器のプロ2り図、及び図9A及び図9B:よ本発明の可変レート符号化 方式を説明するための図である。Figure 5 is a block diagram illustrating the principles of the delta codebook; Figures 6A and 6B are diagrams illustrating the adaptation method for a tree-structured delta codebook; Figures τA, τB, and τC are diagrams illustrating the details of the present invention; Figure 8 is a diagram of the speech coder of the present invention; and Figures 9A and 9B are diagrams illustrating the variable rate coding method of the present invention.
発明を実施するための最良の形態 音声には有声音と無声音とがあり、有声音は声帯の振動によるパルス音源が基と なって発生し、個人個人のノドや口の声道特性が付加されて声になる。また、無 声音は声帯を振るわせないで出す音で、単なるガウス性の雑音列が音源となって 声道を通って声となる。従って、音声発生メカニズムは図1に示すように、有声 音の元となるパルス音5pscと無声音の元となる雑音源NSCと、各音源から 出力される信号に声道特性を付加する線形予測合成フィルタLPCFによりモデ ル化できる。尚、人の声はピッチ周期性を有し、該周期性はパルス音源から出力 されるパルスの周期性に対応しており、人や話の内容によって異なる。BEST MODE FOR CARRYING OUT THE INVENTION Speech can be divided into voiced and unvoiced sounds. Voiced sounds are generated by a pulse source produced by vocal cord vibration, and are then transformed into voice by the addition of individual vocal tract characteristics of the throat and mouth. Unvoiced sounds are produced without vocal cord vibration; a simple Gaussian noise source is the source, passing through the vocal tract and becoming voice. Therefore, as shown in Figure 1, the speech generation mechanism can be modeled using a pulse sound (5psc) that is the source of voiced sounds, a noise source (NSC) that is the source of unvoiced sounds, and a linear predictive synthesis filter (LPCF) that adds vocal tract characteristics to the signals output from each sound source. Human voices have pitch periodicity, which corresponds to the periodicity of the pulses output from the pulse source and varies depending on the person and the content of speech.
以上のことから、入力音声に対応するパルス音源の周期と雑音源の雑音列を特定 することができれば、これらパルス周期と雑音源の雑音列を識別する符号(イン デックス)により入力音声を符号化することができる。Therefore, if we can identify the period of the pulse source and the noise sequence corresponding to the input speech, we can encode the input speech using a code (index) that identifies these pulse periods and the noise sequence.
ここで、図2に示すように、過去の値(bP+gC)を異なるサンプル数遅延さ せて得られるベクトルPを適応符号帳11に格納し、適応符号帳11内のベクト ルPにゲインbを乗したベクトルbpを線形予測合成フィルタ12に入力してフ ィルタ演夏処理を施し、得られたフィルタ演夏結果bAPを入力音声信号Xから 減算してその誤差信号から誤差電力評価部13において該差電力が最小となる適 応符号帳11のベクトルPを選択することにより、周期を決定する。As shown in FIG. 2, vector P obtained by delaying past values (bP + gC) by different sample numbers is stored in adaptive codebook 11. Vector P in adaptive codebook 11 is multiplied by gain b to obtain vector bp, which is input to linear predictive synthesis filter 12 for filter processing. The resulting filter processing result bAP is subtracted from input speech signal X, and error power evaluation unit 13 selects vector P from adaptive codebook 11 that minimizes the difference power from the resulting error signal, thereby determining the period.
その後又はこれと同時に、予め複数の雑音列(各雑音列はN次元のコードベクト ルで表現されている)を雑音符号帳1に用意しておき、各コードベクトルCにゲ インgを乗じ線形予測合成フィルタ3の処理を施した再生信号ベクトルgACと 入力信号ベクトルX(N次元ベクトル)との誤差が最小となるコードベクトルを 誤差;力評価部5が決定すれば、前記周期とコードベクトルを特定するデータ( インデックス)により音声を符号化することができる。なお、図2を参照して上 記に説明した例は、ベクトルACとベクトルAPが直交化されている場合の例で あり、そうでない場合には、入力信号ベクトルXからベクトルbAPを差し引い たベクトルX−bAPとの誤差が最小となるコードベクトルを決定する。Subsequently, or simultaneously, multiple noise sequences (each represented by an N-dimensional code vector) are prepared in the noise codebook 1, and each code vector C is multiplied by a gain g and processed by the linear predictive synthesis filter 3 to obtain a reproduced signal vector gAC. The error vector evaluator 5 then determines the code vector that minimizes the error between the reproduced signal vector gAC and the input signal vector X (an N-dimensional vector). Once this is determined, speech can be encoded using the period and data (index) that specifies the code vector. Note that the example described above with reference to FIG. 2 is an example in which vector AC and vector AP are orthogonal. If this is not the case, a code vector that minimizes the error between vector X - bAP, which is obtained by subtracting vector bAP from input signal vector X, is determined.
図3はA−b−3法によるベクトル量子化を用いた音声伝送(符号化)方式の構 成図で図2の下半分に相当している。詳しく述べると1はN次元コードベクトル CをサイズMだけ記憶する雑音符号帳、2はゲインgの増幅部、3は入力信号X から線形予測分析により決定された係数を有し、増幅部2の出力に線形予測フィ ルタ演算処理を施す線形予測合成フィルタ、4は線形予測合成フィルタ3から出 力される再生信号ベクトルと入力信号ベクトルの誤差を出力する誤差発生部、5 は該誤差を評価し、該誤差が最小となるコードベクトルをめる誤差電力評価部で ある。Figure 3 is a block diagram of a speech transmission (encoding) system using vector quantization based on the A-b-3 method, corresponding to the lower half of Figure 2. Specifically, reference numeral 1 denotes a random codebook that stores an N-dimensional code vector C of size M; 2 denotes an amplifier with gain g; 3 denotes a linear predictive synthesis filter that has coefficients determined by linear predictive analysis of the input signal X and performs linear predictive filtering on the output of amplifier 2; 4 denotes an error generator that outputs the error between the reproduced signal vector output from linear predictive synthesis filter 3 and the input signal vector; and 5 denotes an error power evaluator that evaluates the error and selects the code vector that minimizes the error.
このA−b−3法による量子化では通常のベクトル量子化と異なり、雑音符号I 11の各コードベクトル(C)に最適のゲイン(g)を掛けた後、線形予測合成 フィルタ3でフィルタ処理を施し、このフィルタ処理で得られる再生信号ベクト ル(gAC)と入力信号ベクトル(X)との間の誤差信号(E)を誤差発生部4 でめ、誤差電力評価部5で誤差信号の電力を評価関数(距離尺度)として雑音符 号帳】の探索を行い、誤差電力が最小となるコードベクトルをめ、該コードベク トルを特定する符号(インデックス)により入力信号を符号化して伝送する。Unlike conventional vector quantization, this A-b-3 quantization method multiplies each code vector (C) in the random code I (11) by an optimal gain (g), then filters it through a linear predictive synthesis filter (3). The error signal (E) between the reproduced signal vector (gAC) obtained through this filtering and the input signal vector (X) is generated by an error generator (4). The error power evaluator (5) then searches the random codebook using the power of the error signal as an evaluation function (distance measure) to find the code vector with the smallest error power. The input signal is then encoded using a code (index) that identifies that code vector and transmitted.
このときの誤差電力は次式 %式%(1) により与えられる。最適なコードベクトル及びゲインgは、二の(1)式に示す 誤差電力を最小化するものとして決定される。尚、声の大きさによりパワーが異 なるので、ゲインgを最適化して再生信号パワーを入力信号のパワーに合わせる 。最適ゲインは(1)式をgで偏微分してOと置くことによりめることができる 。即ち、dlEl”/dg=Q より、gは g = (X” AC)/((AC)” (AC)) (2)で与えられる。こ のgを(1)式に代入すると、IEI”−IXI” −(χ丁 AC)!/(( AC)’(AC)) (3)となる。入力信号Xと線形予測合成フィルタ3の出 力ACの相互相関をRXC1線形予測合成フィルタ3の出力ACの自己相関をR CCとすれば、相互相関及び自己相関は次式 %式%(4) により表現される。The error power in this case is given by the following equation: Equation (1) The optimal code vector and gain g are determined to minimize the error power shown in Equation (1). Note that power varies depending on the voice volume, so the gain g is optimized to match the playback signal power to the input signal power. The optimal gain can be determined by partially differentiating Equation (1) with respect to g and substituting O. That is, dlEl"/dg = Q, so g is given by g = (X" AC)/((AC)"(AC)) (2). Substituting this g into equation (1), we obtain IEI"-IXI"-(X" AC)!/((AC)'(AC)) (3). If the cross-correlation between the input signal X and the output AC of the linear prediction synthesis filter 3 is RXC1 and the auto-correlation of the output AC of the linear prediction synthesis filter 3 is RC, then the cross-correlation and auto-correlation are expressed by the following equations: Equation (4)
(3)式の誤差電力を最小にするコードベクトルCは(3)式の右辺第2項を最 大にするものであるから、該コードベクトルCは次式 %式%(6) と表現でき、最適のゲインは(6)式を満たす相互相関、及び自己相関を用いて (2)式より g”Rxc/Rcc (7) で与えられる。The code vector C that minimizes the error power of equation (3) maximizes the second term on the right-hand side of equation (3). Therefore, the code vector C can be expressed as follows: %Equation%(6) The optimal gain is given by g"Rxc/Rcc (7) from equation (2) using the cross-correlation and auto-correlation that satisfy equation (6).
図4は以上の式により、誤差電力が最小となるコードベクトルをめて入力信号を 符号化する雑音符号帳探索処理アルゴリズムをモデル化した構成図であり、相互 相関Rxc(”χ丁AC)を演算する演算部6と、この相互相関RXCの二乗を 演算する演算部7と、ACの自己相関RCCを演算する演算部8と、Rxc” / Rccを演算する演算部9と、RXC” / Rccが最大となる、換言す れば誤差電力が最小となるコードベクトルを決定して該コードベクトルを特定す る符号を出力する誤差電力評価部5とが設けられているが、等価的に図3と同じ ものである。Figure 4 is a block diagram modeling the noise codebook search algorithm that, based on the above equations, selects the code vector that minimizes the error power and encodes the input signal. It includes a calculation unit 6 that calculates the cross-correlation Rxc ("xAC"), a calculation unit 7 that calculates the square of this cross-correlation RXc, a calculation unit 8 that calculates the autocorrelation RCC of AC, a calculation unit 9 that calculates Rxc"/Rcc, and an error power evaluation unit 5 that determines the code vector that maximizes RXc"/Rcc, in other words, minimizes the error power, and outputs a code that identifies that code vector. However, this is equivalent to Figure 3.
このような従来の符号帳探索処理の内で主なものは、■コードベクトルCに対す るフィルタ処理、■相互相関RXCの算出処理、及び■自己相関RCCの算出処 理の3つである。 LPCフィルタ3の次数をNP、ベクトル量子化(コードベ クトル)の次元をNとすると、1つのコードベクトルに対して、■〜■のそれぞ れに要する演算量はNP ・N、N、及びNである。従って、1つのコードベク トル当たりの符号帳探索に要する演算量は(Np=2) ・Nとなる。The main components of this conventional codebook search process are: (1) filtering of the code vector C, (2) calculation of the cross-correlation RXC, and (3) calculation of the auto-correlation RCC. If the order of the LPC filter 3 is NP and the dimension of the vector quantization (code vector) is N, then the computational complexity required for (1) through (2) for one code vector is NP·N, N, and N, respectively. Therefore, the computational complexity required for a codebook search per code vector is (Np = 2)·N.
通常用いられている雑音符号帳lは、40次元・符号帳サイズ1024(N=4 0. M−1024)程度のものであり、LPGフィルタ3の分析次数N、が1 0次程度であるため、1回の符号帳探索に(10+2 ) ・40・1024= 480 xlO’の積和算を要する。A commonly used noise codebook l has approximately 40 dimensions and a codebook size of 1024 (N = 40.M - 1024). Since the analysis order N of the LPG filter 3 is approximately 10th order, one codebook search requires (10 + 2) × 40 × 1024 = 480 × 10' multiplication and addition operations.
この欅な符号帳探索を音声符号化のサブフレーム(5m5ec)毎に行うために は、96門ops (メガオペレーン3フフ秒)という膨大な処理能力が必要と なり、現在最高速のディジタル・ジクナル・プロセッサ(許容演算量20〜40 Mops)を使用しても、その実時間実現には数チップを要してしまう。To perform this complex codebook search every subframe (5m5ec) of speech coding, a massive processing power of 96 ops (3 mega-operators per second) would be required. Even with the fastest digital processors available today (capacity of 20-40 MOPs), real-time implementation would require several chips.
また、この様な雑音符号帳1をテーブルとして記憶・保持するために:=、N ・M (=40 1024=1024=40Kものメモリ容量が必要になって′ −よう。Furthermore, to store and maintain such a noise codebook 1 as a table, a memory capacity of N × M (= 40 × 1024 = 1024 = 40K would be required.
更には、A−b−5型ベクトル量子化を用いた音声符号器の適用分野と考えられ る自動車電話・携帯電話において;=、装置の小型化・低消費電力化が必須の条 件てあり、膨大な演算量や膨大なメモリ容量は、いずれも音声符号器実現上で重 大な障害となっている。Furthermore, in the case of mobile phones and cellular phones, which are considered to be potential applications of speech coders using A-b-5 vector quantization, miniaturization and low power consumption are essential requirements. The enormous computational complexity and memory requirements pose significant obstacles to the realization of speech coders.
以上のことから本願の出願人は、特願平3−127669号(特開平4−352 200号公報)において、雑音符号帳探索に要する演算量を減少でき、しかも雑 音符号帳の記憶に要するメモリ容量を減少できる音声符号化方式を提供するため 、従来の雑音符号帳の代わりに図5に示す木構造デルタ符号帳を用いることを提 案した。Based on the above, the applicant of the present application proposed in Japanese Patent Application No. 3-127669 (JP Patent Publication No. 4-352200) the use of a tree-structured delta codebook, as shown in FIG. 5, instead of a conventional stochastic codebook, in order to provide a speech coding method that can reduce the amount of calculation required for stochastic codebook search and also reduce the memory capacity required for storing the stochastic codebook.
図5において、予め1つの基準雑音列である初期ベクトルC0(=Δ。)と(L −1)種類(階層)のデルタ雑音列であるデルタベクトルΔ1〜ΔL−1(L= IO)をデルタ符号帳10に格納しておき、木構造に従ってデルタベクトルΔ1 〜ΔL−1をそれぞれ初期ベクトルC0に階層毎に加え合わせ及び差し引くこと により順次木構造上に(2”−1)種類の雑音列のコードベクトル(符号語)0 0〜C5゜2□を表現できるようにする。またはこれらコードベクトルに一00 ベクトル(又は零ベクトル)を加えて2111の雑音列のコードベクトル(符号 語)C0〜C1゜1.を表現できるようにする。In FIG. 5 , an initial vector C0 (= Δ) which is a reference noise sequence and delta vectors Δ1 to ΔL-1 (L = 10) which are (L-1) types (layers) of delta noise sequences are stored in the delta codebook 10 in advance. By adding and subtracting delta vectors Δ1 to ΔL-1 to the initial vector C0 at each layer according to the tree structure, it is possible to sequentially represent code vectors (codewords) C0 to C5°2 of (2-1) types of noise sequences on the tree structure. Alternatively, a zero vector (or a zero vector) can be added to these code vectors to represent code vectors (codewords) C0 to C1°1 of 2-11 noise sequences.
このようにすれば、デルタ符号帳10に初期ベクトルΔ。と(L−1)種類のデ ルタベクトルΔ1〜ΔL−1(L=10)を格納しておくだけで、次々と2L− 1(=2”−1=M−1)種類リコードベクトル又は2 L(= 2 I0=M )種類のコードベクトルを生成することができ、デルタ符号帳10の記憶容量を L−N(=10・N)とすることができ、従来の雑音符号帳の記憶容量M −N (=1024・N)に比べて著しく減少させることができる。In this way, simply storing the initial vector Δ and (L-1) delta vectors Δ1 to ΔL-1 (L = 10) in the delta codebook 10 allows for the sequential generation of 2L-1 (= 2′-1 = M-1) recode vectors or 2L (= 2L = M) code vectors. This reduces the storage capacity of the delta codebook 10 to L-N (= 10·N), a significant reduction compared to the storage capacity of conventional random codebooks, M-N (= 1024·N).
この様な構成の木構造デルタ符号帳IOを用いれば、コードベクトルCr (j = 0〜1022または1023)に対する相互相関R、c′I+ と自己相関 Rcc′I+ は次の様な漸化式て表現することができる。すなわち、各コード ベクトルを (zk、、 w C,−Δ、 i −1、2−L −1(8)またはCtw−z 篇Ck−Δ、2;−+−1≦k<2”−1(9)と表わすとき、 R,clZk−11−Rxc +l+l −I−X ?(AΔi) (10)ま たは R,clZk−H−Rxc N+) X T (AΔ、) (11)及び Rec Itk−11−Rcc tkl +(AΔ、)T(AΔ、) +2 ( AΔi)’(Ach) (12)または Rcc +!に一!l x Rcc +に+ + (AΔ、)’(AΔi) − 2(AΔi)”(ACk) (13)と表現することができる。Using this tree-structured delta codebook IO, the cross-correlation R, c'I+ and autocorrelation R, c'I+ for the code vector Cr (j = 0 to 1022 or 1023) can be expressed by the following recursive formula. That is, when each code vector is expressed as (zk, , w C, -Δ, i -1, 2 - L -1 (8) or Ctw - z Ck -Δ, 2; -1 ≤ k < 2 -1 (9), R, clZk-11 - Rxc + l + l - I - X (AΔi) (10) or R, clZk-H - Rxc N+) X T (AΔ,) (11) and Rec Itk-11 - Rcc tkl + (AΔ,) T (AΔ,) + 2 ( AΔi)' (Ach) (12) or Rcc +! に一! ! l x Rcc + + (AΔ,)' (AΔi) - 2 (AΔi)" (ACk) (13).
従って、相互相関Rxcに関しては、各デルタベクトルΔ、(i=0〜L−1; Δ、−C,)についての相互相間XT(AΔ、)の演算を行えば、漸化式(10 ) (11”)式に従って、すなわち図5の木構造に従ってこれらを順次加算又 はfiIi夏することにより、すべてのコードベクトルC1に対する相互相関R 8♂Jゝが直ちに計算される。従来の符号帳では、全雑音列のコードベクトルに 対する相互相関を演算するのに M −N (−1024・N) 回の積和真が必要であった。これに対して、木構造デルタ符号帳では、相互相関 R,efj+ を各符号ベクトルC,(j−0,1−2L−1)から直接計算せ ず、各デルタベクトルΔj(j−0,1,・・・L−1)との相互相関を計算し 、それらを順次加算又はyIi夏することによって算出しているので、 L−N(−10・N) 回の積和算で済ますことが可能となり、演算回数を著しく減少できる。Therefore, with regard to the cross-correlation Rxc, once the cross-correlation XT(AΔ,) for each delta vector Δ (i = 0 to L-1; Δ, -C,) is calculated, the cross-correlation R for all code vectors C1 can be immediately calculated by sequentially adding or subtracting these according to the recurrence formulas (10) and (11), i.e., the tree structure of Figure 5. In conventional codebooks, it takes many iterations to calculate the cross-correlation for the code vectors of all noise sequences. Previously, -N (-1024 × N) multiplication and addition operations were required. In contrast, with a tree-structured delta codebook, the cross-correlation R,efj+ is not calculated directly from each code vector C,(j-0,1-2L-1), but is calculated by calculating the cross-correlation with each delta vector Δj(j-0,1,...L-1) and then sequentially adding or subtracting them. This reduces the number of multiplication and addition operations to only L-N (-10 × N), significantly reducing the number of calculations.
また自己相関の式(12) (13)の第3項の交さ項(^Δi)” (AC− については、 Cy=Δ。±Δ1±Δ2・・・±Δi−1と表わせば (AΔi)”(ACk) = (AΔ、)”(AΔ。)±(AΔ、)T(AΔl )=・・・±(AΔ、)” (AΔi−、) (14)と表わすことができるか ら、Δ、とΔ。、Δ1・・・Δi−1との相互相関(AΔ、)T(^Δ。+ I + 2”、1−1)の計算を行い、図5の木構造に従って順次加算又は減算を行 えば第3項が算出される。さらに第2項の各デルタベクトルΔ3の自己相関(A Δi)’(AΔ8)を計算し、これを(12) (13)式に従って、すなわち 図5の木構造に従って順次加算又は減算すれば、すべてのコードベクトルCJの 自己相関R,cりj+ が直ちに計算される。Furthermore, the cross term (^Δi)"(AC- in the third term of the autocorrelation equations (12) and (13) can be expressed as Cy = Δ.±Δ1±Δ2...±Δi-1. (AΔi)"(ACk) = (AΔ,)"(AΔ.)±(AΔ,)T(AΔl) =...±(AΔ,)"(AΔi-,) (14). Therefore, the cross-correlation between Δ and Δ.,Δ1...Δi-1 (AΔ,)T(^ Δ. + I + 2", 1-1) and sequentially add or subtract according to the tree structure of Figure 5 to calculate the third term. Furthermore, by calculating the autocorrelation (A Δi)' (AΔ8) of each delta vector Δ3 in the second term and sequentially adding or subtracting it according to equations (12) and (13), i.e., according to the tree structure of Figure 5, the autocorrelations R, c, j+ of all code vectors CJ can be immediately calculated.
すなわち、従来の符号帳では、自己相関を演算するのにM −N (=1024 ・N) 回の積和算が必要であった。これに対して、木構造デルタ符号帳では、自己相関 Rxc+J)を各符号ベクトルCJ(j−0,1−2L−’−1)から直接計算 せず、各デルタベクトルΔj(j=0.1.・・・L−1)の自己相関及び異な るデルタベクトルのすべての組み合わせにおける相互相関から計算しているので 、 L(LSI) ・N/2(=55・N)回の積和算で済ますことが可能となり、 演算回数を著しく減少できる。That is, with conventional codebooks, calculating the autocorrelation required M-N (= 1024·N) product-sum calculations. In contrast, with tree-structured delta codebooks, the autocorrelation (Rxc+J) is not calculated directly from each code vector CJ (j-0, 1-2L-'-1), but is calculated from the autocorrelation of each delta vector Δj (j = 0, 1...L-1) and the cross-correlation between all combinations of different delta vectors. This reduces the calculation time to just L(LSI)·N/2 (= 55·N) product-sum calculations, significantly reducing the number of calculations.
ところが、この様な木構造デルタ符号帳の符号語(コードベクトル)は全てデル タベクトルの線形結合とじて生成されているため、その成分としてデルタベクト ル以外の成分は持たない。即ち、符号化対象のベクトルが分布する空間(通常、 40〜64次元)のうち、高にデルタベクトルの数(通常、8〜10本)に対応 する次元分の部分空間にしか符号ベクトルの分布を与えられなし・。However, because all codewords (code vectors) in such a tree-structured delta codebook are generated as linear combinations of delta vectors, they contain no components other than delta vectors. In other words, within the space in which the vectors to be coded are distributed (typically 40-64 dimensions), the code vectors can only be distributed in a subspace with dimensions corresponding at most to the number of delta vectors (typically 8-10).
従って、木構造デルタ符号帳では、符号化対象である音声信号の統計的分布に基 つき充分に基底ベクトル(デルタベクトル)を設計したとしても、従来の構造上 の制約の無い符号帳に比べて量子化特性が劣化するという問題があった。Therefore, even if the basis vectors (delta vectors) are designed based on the statistical distribution of the speech signal to be coded, the tree-structured delta codebook suffers from the problem of degraded quantization characteristics compared to conventional codebooks without structural constraints.
ところで、本発明の適用の対象となるCELP型音声符号器では、上述したよう にベクトル量子化は通常のベクトル量子化と異なり、符号ベクトルにフィルタの 伝達間数Azを存する線形予測合成フィルタを施した信号ベクトルの空間におい て距離評価を行い、最適なベクトルを決定するものである。As described above, in the CELP speech coder to which the present invention is applied, vector quantization differs from conventional vector quantization in that it performs distance evaluation in a space of signal vectors obtained by applying a linear predictive synthesis filter having a filter transfer function Az to a code vector, thereby determining the optimal vector.
従って、図6A及び6Bに示すように、線形予測合成フィルタによって残差信号 の空間(L=3の場合図6Aの球体)は再生信号の空間に変換されるが、この時 、一般には図6Bに示すように各軸の方向成分が均等ではなく、成る歪みをもっ た増幅が行われる。Therefore, as shown in FIGS. 6A and 6B, the linear predictive synthesis filter transforms the residual signal space (the sphere in FIG. 6A when L=3) into the reproduced signal space. However, during this process, the directional components along each axis are generally not uniform, as shown in FIG. 6B, resulting in distortion-inducing amplification.
つまり、線形予測合成フィルタの特性(A)が符号帳の構成要素である各デルタ ベクトルに対して異なる振幅増幅特性を示すもので、結果のベクトルは全空間に わたって均等に分布しない。That is, the linear prediction synthesis filter characteristic (A) exhibits different amplitude amplification characteristics for each delta vector that constitutes the codebook, and the resulting vectors are not evenly distributed across the entire space.
また、図5に示される木構造デルタ符号帳において:よ、各デルタベクトルが符 号ベクトルに与える寄与はデルタベクトルがデルタ符号帳10内で置かれる位置 によって異なる。例えば、2番目に置かれたデルタベクトルΔI は第2Vk層 以下のすべての符号ベクトルに寄与するのに対しで、第3番目のデルタへクトル Δ2は第3階層以下のすべての符号ベクトルに寄与し、Δ、は第10階層の符号 ベクトルのみに寄与する。すなわち、デルタベクトルの順番を変えれば、各デル タベクトルの符号へクトルへの寄与を変えることができる。Furthermore, in the tree-structured delta codebook shown in Figure 5, the contribution of each delta vector to a code vector varies depending on the delta vector's position in the delta codebook 10. For example, the second delta vector ΔI contributes to all code vectors in the second Vk layer and below, while the third delta vector Δ2 contributes to all code vectors in the third layer and below, and Δ contributes only to code vectors in the tenth layer. In other words, by changing the order of the delta vectors, the contribution of each delta vector to a code vector can be changed.
以上のことから、本願出願人は特願平3−515016号において、先ス各デル タベクトルΔ、ユニフィルタ特性(A)を施したベクトルAΔ、S二ついてパワ ー(の増幅率:各デルタベクトルが規格化されていればAΔ8のパワーそのもの が増幅率となる)IAΔ、:2=(AΔi)’(AΔ8)を計算して相互に比較 し、パワーの大きいデルタベクトルから順に並べ替えを行ってできた符号帳を用 いて符号化を行うことで、固定的にデルタベクトルを与えることにより分布に偏 りを有する従来の木構造デルタ符号帳に比して特性の改善を得ることができた。Based on the above, in Japanese Patent Application No. 3-515016, the applicant calculated the power (amplification factor: if each delta vector is normalized, the power of AΔ itself becomes the amplification factor) I AΔ, :2 = (AΔi)'(AΔ) for each delta vector Δ, vector AΔ with unifilter characteristics (A), and S, and compared them. Then, the delta vectors were rearranged in descending order of power. This resulted in improved performance compared to conventional tree-structured delta codebooks, which have a biased distribution due to the fixed delta vectors.
しかしながら、この場合にもデルタベクトルの数は実際に用いられる数と同数で あり、それらの中での並べ替えたデルタベクトルにより符号化を行うので、符号 帳の自由度に制約がある。However, even in this case, the number of delta vectors is the same as the number actually used, and encoding is performed using delta vectors that are rearranged from among them, so the flexibility of the codebook is limited.
例えば議論を簡単にするため、L=2の場合、すなわちベクトルC,(=Δ0) とデルタベクトルΔ1 とから符号ベクトルC0゜C1(=Δ0+Δ、)、C, (=Δ。−Δl)を生成する木構造デルタ符号帳の場合を考える0図7Aに示す ようにΔ。、Δ、として使用するベクトルを単位ベクトルeつ、eyに限定する と、順番を入れ替えたとしても生成される符号ベクトルは斜線で表わすx−y平 面内に限定される。一方、三つの線形独立な単位ベクトルe z 、e y + etの中から必要に応じて2つを選んでΔ。、Δ1 として使用する場合、図 7A〜7Cに示されるように、部分空間の選択の自由度が広がる。For example, to simplify the discussion, consider the case of L = 2, i.e., a tree-structured delta codebook that generates code vectors C0C1 (= Δ0 + Δ1) and C1 (= Δ1 - Δ1) from vector C1 (= Δ0) and delta vector Δ1. As shown in Figure 7A, if the vectors used as Δ1, Δ2 are limited to unit vectors e and ey, then the generated code vectors are limited to the x-y plane indicated by the diagonal lines, even if the order is changed. On the other hand, if two of the three linearly independent unit vectors e z and ey + e are selected as needed to be used as Δ1, Δ1, the degree of freedom in selecting subspaces is expanded, as shown in Figures 7A-7C.
′告−゛ルタτ6 の そこで本発明では、更なる改善を加えるために、デルタベクトル符号帳において 実際に符号帳を構成する際に用いられるデルタベクトル(L本=初期ベクトル〒 L−]本のデルタベクトル)より多くのデルタベクトルの候補(L’本:L’> L)を与え、これらの候補に対して上記と同様の操作を行って並べ替えを施した 後、振幅増幅率が上位のものから所望の数(L本)だけのデルタベクトルを選定 −で符号帳を構成する。このようにすることて、自由度の高い符号帳を得ること が可能になり、量子化特性の改善が図られている。'Announcement-' Filter τ6 To further improve the codebook, the present invention provides a larger number of delta vector candidates (L': L' > L) than the delta vectors actually used to construct the codebook (L = initial vector 〒 L-] delta vectors. These candidates are then reordered using the same procedure as above. After that, the desired number (L) of delta vectors with the highest amplitude amplification factors are selected to construct the codebook. This allows for a codebook with a high degree of flexibility, resulting in improved quantization characteristics.
尚、上記は符号器についてのものであるが、この符号器に対向する復号器におい ても、符号器側と同しデルタベクトルの候補を備え、符号器側と同様の制御を行 うことにより、常に符号器側と同内容の符号帳を生成して用いることで、符号器 側との対向性を確保することができる。While the above description applies to the encoder, the decoder can also be configured with the same delta vector candidates and controlled in the same way as the encoder, ensuring compatibility with the encoder by always generating and using the same codebook as the encoder.
図8は上記思想に基づく本発明に係る音声符号化方式の実施例を表わすブロック 図である。この実施例においてデルタベクトル符号帳10は、1つの基準雑音列 を表現する初期ベクトルC0(=Δ。)と実際に使用する(L−1)本より多い (L’−1)本のN次元のデルタ雑音列を表現するデルタベクトルΔ1〜ΔL・ −1を記憶・保持するように構成されており、初期ベクトルc0及び各デルタベ クトルΔ1〜Δ、・−1はそれぞれN次元で表現されている。すなわち、初期ベ クトル及びデルタベクトルは時系列的に発生するNサンプルの雑音の振幅をそれ ぞれコード化したN次元のベクトルである。Figure 8 is a block diagram showing an embodiment of a speech coding method according to the present invention based on the above concept. In this embodiment, delta vector codebook 10 is configured to store and retain initial vector C0 (=Δ) representing one reference noise sequence and delta vectors Δ1 through ΔL·-1 representing N-dimensional delta noise sequences (L'-1) in number, which is greater than the (L-1) sequences actually used. Initial vector c0 and each delta vector Δ1 through Δ·-1 are each expressed in N dimensions. In other words, the initial vector and delta vector are N-dimensional vectors that each encode the amplitude of N samples of noise occurring in a time series.
また、この実施例では線形予測合成フィルタ3は次数りのIIR型フィルタで構 成されるが、このフィルタのインパルス応答から生成されるNXNの正方行列A とデルタベクトルΔ1の乗算を行って、デルタベクトルΔ、にフィルタ処理Aを 施し、ベクトルAΔ、を出力する。+111型フイルタのNp個の係数は入力音 声信号に基づいて変化し、その都度周知の方法で決定される。すなわち、入力音 声信号の隣接サンプルには相関が存在するから、サンプル間の相関係数をめ、該 相関係数からパーコール係数と称せられる偏自己相関係数をめ、該パーコール係 数からIIR型フィルタのアルファ係数を決定し、当該フィルタのインパルス応 答列を用いてNXNの正方行列Aを作成してベクトルΔ、にフィルタ処理を施す 。In this embodiment, the linear predictive synthesis filter 3 is composed of an IIR filter of order , and an NXN square matrix A generated from the filter's impulse response is multiplied by a delta vector Δ1 to apply filter processing A to the delta vector Δ, outputting vector AΔ. The Np coefficients of the +111 filter vary based on the input speech signal and are determined each time using a well-known method. That is, since there is correlation between adjacent samples of the input speech signal, the correlation coefficient between the samples is obtained, and from this correlation coefficient, a partial autocorrelation coefficient known as the PARCOR coefficient is obtained. The alpha coefficient of the IIR filter is then determined from the PARCOR coefficient, and an NXN square matrix A is created using the filter's impulse response sequence to apply filter processing to vector Δ.
フィルタ処理が施されたL°本のベクトルAΔ、(i=0.1・・・L’−1) は記憶部40に保持され、パワー評価部42においてパワーIAΔ112=(A Δi)”(AΔ、)が評価される。なお、各デルタへクトルΔ、は規格化(1Δ il” = (Δ、)T(Δ1)=1)されているので、パワーの評価をするだ けでフィルタ処理Aによる増幅度が直接評価される0次に、パワー評価部42の 評価結果に基づいてソーティング部43においてパワーの矢きい順に並べ替えら れる6例えば図6Bの例では、 Δ。=et、Δ+=ex+ Δ2=eyの順に並び替えられる。The filtered vectors AΔ, (i = 0.1 ... L'-1) are stored in the memory unit 40, and the power IAΔ112 = (AΔi)"(AΔ,) is evaluated in the power evaluation unit 42. Since each delta vector Δ, is normalized (1Δi" = (Δ,) T(Δ1) = 1), simply evaluating the power directly evaluates the amplification caused by the filter processing A. Based on the results of the power evaluation unit 42, the vectors are sorted in order of power magnitude in the sorting unit 43. For example, in the example shown in Figure 6B, the order is Δ = et, Δ + = ex + Δ2 = ey.
上記のようにして並べ替えられたベクトルAΔ;(i=o、1・・・L’−1) は全部でL°本有るが、以陣の符号化処理は、実際に使用するL本のベクトルA Δ+(i=0.1・・・L−1)により行われる。There are a total of L vectors AΔ; (i = 0, 1 ... L'-1) rearranged as described above, but the encoding process is performed using the L vectors AΔ + (i = 0, 1 ... L-1) that are actually used.
そこで、選定記憶部41では振幅増幅率が大きいものからL本だけベクトルを選 定して記憶する0例えば上記の例では、上記のデルタベクトルの内、Δ。=e8 .及びΔ、 −6、が選定される。そして、これらのベクトルによって構成され る木構成デルタ符号帳に基づいて前述した従来の木構造デルタ符号帳の場合と全 く同様に符号化処理を行う。Therefore, the selection storage unit 41 selects and stores only L vectors with the largest amplitude amplification factors. For example, in the above example, Δ = e8 and Δ = -6 are selected from the delta vectors. Then, based on the tree-structured delta codebook formed by these vectors, encoding is performed in exactly the same manner as in the conventional tree-structured delta codebook described above.
五号化五ユニ詳亙 以下に、選定記憶部41に記憶されたベクトルAΔ。、AΔ1゜AΔ2・・・A ΔL−1からなる木構造デルタ符号帳と、入力信号ベクトルXとから、入力信号 ベクトルXとの距離が最小である符号ベクトルCのインデックスを見い出す符号 化部48の詳細について説明する。Details of the Coder 5 Unit The following describes the details of the encoding unit 48, which finds the index of the code vector C that has the smallest distance from the input signal vector X, using a tree-structured delta codebook consisting of vectors AΔ, AΔ1, AΔ2, ... AΔL-1 stored in the selection storage unit 41 and the input signal vector X.
符号化部48は入力信号ベクトルXと各デルタベクトルΔ、の相互相関X”(A Δ1)を計算する演算部50と、各デルタベクトルΔ8の自己相関(AΔ、)” (AΔ、)を計算する演算部52と、デルタベクトル間の相互相関(AΔi) ” (AΔ。、1□、、、、−、)を計算する演算部54と、演算部54の出力 から交さ項(AΔi)” (ACk)を計算する演算部55と、演算部50から の各デルタベクトルの相互相関を累積して入力信号ベクトルXと符号ベクトルC との相互相関Rxcを算出する演算部56と、演算部52が出力する各デルタベ クトルの自己相関(AΔi)” (AΔ、)と演算部55が出力する交さ項(A Δi)’ (AC,)とを累積して各符号ベクトルCの自己相関を算出する演算 部58と、RC11” / Rccを計算する演算部60と、誤差最小雑音列決 定部62、および音声符号化部64から成っている。The encoding unit 48 includes a calculation unit 50 that calculates the cross-correlation X′′ (AΔ1) between the input signal vector X and each delta vector Δ, a calculation unit 52 that calculates the autocorrelation (AΔ,)′′ (AΔ,) of each delta vector Δ, a calculation unit 54 that calculates the cross-correlation (AΔi)′′ (AΔ, 1□, , , , - ,) between delta vectors, a calculation unit 55 that calculates the cross term (AΔi)′′ (ACk) from the output of calculation unit 54, and a calculation unit 56 that calculates the cross-correlation of each delta vector from calculation unit 50. It consists of a calculation unit 56 that accumulates correlations to calculate the cross-correlation Rxc between the input signal vector X and the code vector C, a calculation unit 58 that accumulates the autocorrelation (AΔi)″ (AΔ,) of each delta vector output by calculation unit 52 and the cross term (AΔi)’ (AC,) output by calculation unit 55 to calculate the autocorrelation of each code vector C, a calculation unit 60 that calculates RC11″/Rcc, a minimum-error noise sequence determination unit 62, and a speech coding unit 64.
最初に、演算中の階層を表すバラメークlが0に設定される。この状態で演算部 50.52ではそれぞれX”(AΔ。)、(AΔ。)7(AΔ。)が計算され出 力される。演算部54.55からは0が出力される。演算部50、52が出力す るχ’(AΔ。)、(AΔ。)’ (AΔ。)はそれぞれ第1階層における相互 相関Rxc 11、自己相関Rcc (Il+ として演算部56.58に記憶 され、出力される。演算部60ではこれらR、cll 、Rcc te+からF (X、 C) = Rxc”/ Rccの値が計算され出力される。Initially, the parameter χ representing the layer being calculated is set to 0. In this state, calculation units 50 and 52 calculate and output X'(AΔ.) and (AΔ.)'(AΔ.), respectively. Calculation units 54 and 55 output 0. The χ'(AΔ.) and (AΔ.)'(AΔ.) output by calculation units 50 and 52 are stored in calculation units 56 and 58 as the cross-correlation Rxc11 and auto-correlation Rcc(11+) at the first layer, respectively, and output. Calculation unit 60 calculates and outputs the value of F(X, C) = Rxc'/Rcc from R, c11, and Rcc(11+).
誤差最小雑音列決定部62では演算されたF (X、 C)とそれ迄のF (X 、 C)の最大値Fwax (初期値は0)を比較し、F (X、 c) >F +waxであれば、F(χ、 C)−FmaxとしてFtaaxを更新すると 共に、Fwaxを与える雑音列(コードベクトル)を特定する符号でそれ迄の符 号を更新する。The minimum-error noise sequence determiner 62 compares the calculated F(X,C) with the maximum value of F(X,C) up to that point, Fwax (initial value 0). If F(X,C) > F+wax, it updates Ftaax as F(x,C) - Fmax, and updates the previous code with a code that specifies the noise sequence (code vector) that gives Fwax.
次にパラメータlが0から1に更新される。この状態で、演算部50、52では それぞれχ”(AΔ+)+ (AΔ、)” (AΔ1)が計算され出力される。Next, parameter l is updated from 0 to 1. In this state, calculation units 50 and 52 respectively calculate and output χ"(AΔ+) + (AΔ,)" (AΔ1).
演算部54では(AΔ+)’ (AΔ。)が計算され出力される。演算部55で はその値を交さ項(AΔl)” (AC,) として出力する。演算部56で: :記憶しているR xe +o+ および演算部50から出力されるX’(AΔ 1)の値から、(10) (11)式に従って第2P!層における相互相関R1 c(1)およびRXc′2) の値を計算し出力し記憶する。演算部5日では、 記憶しているR0♂0′オよび演算部52.55からそれぞれ出力される(AΔ 、)T(AΔ+)、(AΔ+)” (Ac0)の値から、(12) (13)式 に従って、第2階層における自己相関RCC(1)およびRcc(21の値を計 算し出力し記憶する。演算部60および誤差最小雑音列決定部62の動作はI= oのときと同様である。The calculation unit 54 calculates and outputs (AΔ+)' (AΔ). Calculation unit 55 outputs this value as the cross term (AΔl)" (AC,). Calculation unit 56: From the stored Rxe +o+ and the value of X'(AΔ 1) output from calculation unit 50, calculates, outputs, and stores the values of the cross-correlation Rc(1) and Rxc'2) in the second layer according to equations (10) and (11). Calculation unit 56 From the stored R0 0'o and the values of (AΔ 1)T(AΔ+), (AΔ+)" (Ac,) output from calculation units 52 and 55, respectively, calculates, outputs, and stores the values of the autocorrelation RCC(1) and Rcc(2) in the second layer according to equations (12) and (13). The operation of calculation unit 60 and minimum-error noise sequence determination unit 62 is the same as when I = o.
次にパラメータlが1から2に更新される。この状態で、演算部50、52では それぞれX”(AΔz)、 (AΔz)’ (AΔ2)が計算され出力される。Next, parameter l is updated from 1 to 2. In this state, calculation units 50 and 52 calculate and output X"(AΔz) and (AΔz)'(AΔ2), respectively.
演算部54ではΔ2とΔ3.Δ。の相互相関(46g)” (AΔ、)および( AΔz)” (AΔ。)が計算され出力される。演算部55では、それらの値か ら、(14)式に従って交さ項(AΔz)’ (AC+)を計算し出力する。Calculation unit 54 calculates and outputs the cross-correlations (AΔz)' (AΔ) and (AΔz)' (AΔ) between Δ2 and Δ3. Calculation unit 55 calculates and outputs the cross term (AΔz)' (AC+) from these values according to equation (14).
演算部56では記憶しているRXC(1)+ RXC(t’ および演算部50 から入力されるX”(AΔ2)の値から、(10) (11)式に従って第3階 層における相互相関R、cfl−61の値を計算し出力し記憶する。演算部58 では、記憶しているRCC(1)+ Rcc ” および演算部52.55から それぞれ出力される(AΔz)” (AΔア)、(AΔz)” (AC,)の値 から、(12)(13)式に従って、第3階層における自己相関Rcc0″″1 の値を計算し出力し記憶する。演算部60および誤差最小雑音列決定部62の動 作はi =0.1 のときと同様である。Using the stored RXC(1) + RXC(t') and the value of X"(AΔ2) input from calculation unit 50, calculation unit 56 calculates, outputs, and stores the value of the cross-correlation R, cfl-61 at the third layer according to equations (10) and (11). Using the stored RCC(1) + Rcc" and the values of (AΔz)"(AΔa) and (AΔz)"(AC,) output from calculation units 52 and 55, respectively, calculation unit 58 calculates, outputs, and stores the value of the auto-correlation Rcc0""1 at the third layer according to equations (12) and (13). The operation of calculation unit 60 and minimum-error noise sequence determiner 62 is the same as when i = 0.1.
上記の処理を繰り返して1=L−1までの処理が終了したら、音声符号化部64 は誤差最小雑音列決定部62に記憶されている最新の符号を入力信号ベクトルχ との距離が最小である符号ベクトルのインデックスとして出力する。After repeating the above process up to 1 = L - 1, the speech encoding unit 64 outputs the most recent code stored in the minimum-error noise sequence determination unit 62 as the index of the code vector with the smallest distance from the input signal vector χ.
なお、演算部52における(AΔi)” (AΔ、)の演算において、パワー評 価部42の計算結果がそのまま利用できる。In addition, in the calculation of (AΔi)" (AΔ,) in the calculation unit 52, the calculation result of the power evaluation unit 42 can be used as is.
ユI]:二ビ11止 前述の木構造デルタ符号帳及び本発明により改良された木構造味デルタ符号帳を 使用すれば、従来の符号帳で必要とした膨大なメモリを必要とせず、かつ、ビッ トドロップへの対策が可能な可変レート符号化が実現される。By using the aforementioned tree-structured delta codebook and the tree-structured delta codebook improved by the present invention, variable-rate coding can be achieved without the large memory requirements of conventional codebooks and with a built-in countermeasure against bit drop.
すなわち、図9Aに示した構造を有する木構造デルタ符号帳Δ。。That is, a tree-structured delta codebook Δ having the structure shown in FIG.
Δ1.Δ2・・・を格納しておき、図9Bに示すようにこれらのうち第1階層の ベクトルΔ。のみを使って、 C,−O(零ベクトル) C0−Δ。Δ1, Δ2, etc. are stored, and as shown in Figure 9B, only the first-level vector Δ is used to find C, -O (zero vector) C0-Δ.
の2つの符号ベクトルが生成されるようにして符号化を行えば、インデックスデ ータとしてC0を選択するか否かの1ビツトの情報による1ビット符号化が達成 される。By encoding the two code vectors, one bit of information indicating whether or not to select C0 as index data is achieved.
第2階層までのベクトルΔ。、Δ1を使ってC1露O C@3ΔO C3禦Δ。十Δ1 C2富Δ。−Δ1 の4つの符号ベクトルが生成されるようにして符号化を行えば、インデックスデ ータとしてC0の選択の有無およびΔC0又は−ΔCIを指定する2ビツトの情 報による2ビット符号化が達成される。By encoding using the vectors Δ and Δ1 up to the second layer to generate four code vectors: C1 (C3ΔO), C3 (Δ). +Δ1, and C2 (Δ). -Δ1, two-bit encoding is achieved using two bits of information specifying whether C0 is selected and whether ΔC0 or -ΔC1 is selected as index data.
同様にして、第i段階までのベクトルΔ。、Δ1・・・Δ、を使えばiビット符 号化が達成される。したがって、L個のデルタベクトルΔ。、Δ、・・・ΔL− + を含む1組の木構造デルタ符号帳を使うだけで、生成されるインデックスデ ータのビット長を1〜Lの範囲で任意に可変することができる。Similarly, using vectors ΔΨ, Δ1, ... Δ up to the i-th stage, i-bit encoding is achieved. Therefore, by simply using a set of tree-structured delta codebooks containing L delta vectors ΔΨ, Δ, ... ΔL, the bit length of the generated index data can be arbitrarily varied within the range of 1 to L.
従来の符号帳を使って1〜Lビツトの可変ビットレート符号化を行うとすれば、 ベクトルの次元をNとすると、必要なメモリのワード数は N×(2°+2’−・・・+2L)=NX (2L″′−1)である。これに対 して、図9^の木構造デルタ符号帳を図9Bのようにして使用すれば、必要なメ モリのワード数はxL である。To perform variable bit-rate encoding of 1 to L bits using a conventional codebook, where N is the dimension of the vector, the number of memory words required is N x (2° + 2' - ... + 2L) = NX (2L'"' - 1). In contrast, if the tree-structured delta codebook of Figure 9^ is used as shown in Figure 9B, the number of memory words required is xL.
木構造デルタ符号帳としては、前述の並べ替えを行わない木構造デルタ符号帳、 Aによる増幅率の大きさによりデルタベクトルを並べ替えた木構造デルタ符号帳 および、L°本のデータベクトルの中からし本選択して使用する木構造デルタ符 号帳のいずれもが使用可能である。As a tree-structured delta codebook, any of the following can be used: a tree-structured delta codebook that does not perform the reordering described above; a tree-structured delta codebook that reorders delta vectors according to the magnitude of the amplification factor A; or a tree-structured delta codebook that selects and uses one of the L° data vectors.
なお、ピントレートを可変にするll1lは、図8の符号化処理部48における 処理を、所望ビット数に応じて途中の階層で打ち切るようにすれば容易に達成さ れる0例えば4ビット符号化の場合、i x Q。Note that making the focus rate variable can be easily achieved by terminating the processing in the encoding processing unit 48 in Figure 8 at an intermediate layer depending on the desired number of bits. For example, in the case of 4-bit encoding, i x Q.
1.2.3について、前述の符号化処理部48の処理を行うようにすれば良い。Regarding 1, 2 and 3, the processing of the encoding processing unit 48 described above may be performed.
エンベデッド竺6 エンベデノド符号化、すなわち伝送路中で一部のビットが強制的に欠落させられ ても、復号器において音声を再生することのできる符号化システムは、上記の木 構造デルタ符号帳による可変レート符号化において、一部のピントが欠落させら れたら、木構造上でその親または先祖の符号ベクトルとして再生されるように符 号系を構成すれば達成される0例えば4ビツトの符号系CC@、CI ・・・C 54]で1ビツトが欠落させられたら、CI3+CI4は3ビツト系のChとし て、C1□、Cl lは3ビツト系のC2として再生されるように構成する。こ のようにすれば、親子間係にある符号ベクトルは比較的近い値を持つので、大き な音質の劣化なレニこ音声を再生する二とができる。Embedded coding, i.e., a coding system that can reproduce speech at the decoder even if some bits are forcibly dropped during transmission, is achieved by constructing a code system in the tree-structured delta codebook described above so that if some bits are dropped, they are reconstructed as their parent or ancestor code vector in the tree structure. For example, if one bit is dropped in a 4-bit code system CC, CI, ... C, 5, 4, CI3 + CI4 are constructed to be reproduced as a 3-bit system Ch, and C1, CI1 are constructed to be reproduced as a 3-bit system C2. In this way, the code vectors in the parent-child relationship have relatively close values, making it possible to reproduce speech without significant degradation in sound quality.
表1〜4にはこの様な符号系の一例を示す。Tables 1-4 show examples of such code systems.
上記の符号系は、例えば4ビツトの場合、次の例のようにして定められている。The above code system is determined as follows, for example, in the case of 4 bits:
C1,=Δ。−Δ1−Δt−1−Δ、は、4個のデルタ・ベクトルの要素を持ち 、それぞれの符号が、上位から順に(−、−、ふ、十)となるのでこれを“10 11″と表す。C1, = Δ. -Δ1 - Δt - Δ has four delta vector elements, and the signs of each are (-, -, fu, 10) from the most significant, so this is represented as "10 11".
C2=Δ。−Δ、は、2個しかデルタ・ベクトルの要素を持たず、符号は(=、 −)の順である。この場合の符号を(0,0,1−)とみなし、“0010”と 表す。C2 = Δ. -Δ has only two delta vector elements, and the signs are (=, -). In this case, the signs are considered to be (0, 0, 1-) and represented as "0010".
このようにして符号化した情報に対して4ビット→3ビ、トのlビ、トのビット ドロップが生じた場合について表5に示す。Table 5 shows what happens when a bit drop occurs in the information coded in this way: 4 bits → 3 bits, 1 bit, 1 bit.
表5と図9Aを参照すればわかるように、1ビツトの欠落が生しると、tPi層 上層上へクトルとして再生される。As can be seen from Table 5 and Figure 9A, if a single bit is missing, it is regenerated as a vector on the tPi layer and on the upper layer.
また、2ピントの欠落が生じると表6のように再生される。Furthermore, if two out-of-focus images occur, they are reproduced as shown in Table 6.
この場合、2階層上位の先祖のベクトルとして再生される。In this case, it is reproduced as the ancestor vector two levels higher.
表7〜lOには本発明のエンベデッド符号系の他の例を示す。Tables 7-10 show other examples of embedded code systems of the present invention.
この符号系においても、1ビツト欠落が生じたらその親のベクトルが、2ビツト 欠落が生じたら、2階層上位の先祖のベクトルが再生される。In this coding system, if one bit is missing, the parent vector is regenerated, and if two bits are missing, the ancestor vector two levels above is regenerated.
Claims (1)
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP24649192 | 1992-09-16 | ||
| JP4-246491 | 1992-09-16 | ||
| PCT/JP1993/001323 WO1994007239A1 (en) | 1992-09-16 | 1993-09-16 | Speech encoding method and apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO1994007239A1 true JPWO1994007239A1 (en) | 1994-10-06 |
| JP3531935B2 JP3531935B2 (en) | 2004-05-31 |
Family
ID=17149194
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP50796994A Expired - Fee Related JP3531935B2 (en) | 1992-09-16 | 1993-09-16 | Speech coding method and apparatus |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP3531935B2 (en) |
| WO (1) | WO1994007239A1 (en) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2914305B2 (en) * | 1996-07-10 | 1999-06-28 | 日本電気株式会社 | Vector quantizer |
| US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
| GB2346785B (en) * | 1998-09-15 | 2000-11-15 | Motorola Ltd | Speech coder for a communications system and method for operation thereof |
| DE10101121A1 (en) * | 2001-01-05 | 2002-07-11 | Deutsche Telekom Ag | Message playback method for mailbox using telephone connected to mailbox and playing back message at different speeds controlled by program on computer |
| US10991001B2 (en) | 2013-03-13 | 2021-04-27 | Eversight, Inc. | Systems and methods for intelligent promotion design with promotion scoring |
| US10984441B2 (en) * | 2013-03-13 | 2021-04-20 | Eversight, Inc. | Systems and methods for intelligent promotion design with promotion selection |
| US20220207548A1 (en) | 2013-03-13 | 2022-06-30 | Eversight, Inc. | Systems and methods for contract based offer generation |
| US11270325B2 (en) | 2013-03-13 | 2022-03-08 | Eversight, Inc. | Systems and methods for collaborative offer generation |
| US11941659B2 (en) | 2017-05-16 | 2024-03-26 | Maplebear Inc. | Systems and methods for intelligent promotion design with promotion scoring |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5912499A (en) * | 1982-07-12 | 1984-01-23 | 松下電器産業株式会社 | speech encoding device |
| JPS61184928A (en) * | 1985-02-12 | 1986-08-18 | Nippon Telegr & Teleph Corp <Ntt> | Sound signal extracting system |
| JPH0255400A (en) * | 1988-08-22 | 1990-02-23 | Matsushita Electric Ind Co Ltd | Audio encoding method |
| JPH04352200A (en) * | 1991-05-30 | 1992-12-07 | Fujitsu Ltd | Speech encoding system |
| FI98104C (en) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Procedures for generating an excitation vector and digital speech encoder |
| JP3275247B2 (en) * | 1991-05-22 | 2002-04-15 | 日本電信電話株式会社 | Audio encoding / decoding method |
| JP3132081B2 (en) * | 1991-09-30 | 2001-02-05 | 日本電気株式会社 | Code-driven LPC speech encoder |
| JP3071012B2 (en) * | 1991-12-09 | 2000-07-31 | 富士通株式会社 | Audio transmission method |
| JPH05232996A (en) * | 1992-02-20 | 1993-09-10 | Olympus Optical Co Ltd | Voice coding device |
-
1993
- 1993-09-16 JP JP50796994A patent/JP3531935B2/en not_active Expired - Fee Related
- 1993-09-16 WO PCT/JP1993/001323 patent/WO1994007239A1/en not_active Ceased
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3112681B2 (en) | Audio coding method | |
| RU2462769C2 (en) | Method and device to code transition frames in voice signals | |
| US5717824A (en) | Adaptive speech coder having code excited linear predictor with multiple codebook searches | |
| JPWO1992005541A1 (en) | Audio coding method | |
| KR101175651B1 (en) | Multiple compression coding method and apparatus | |
| KR19980080463A (en) | Vector quantization method in code-excited linear predictive speech coder | |
| US20130218578A1 (en) | System and Method for Mixed Codebook Excitation for Speech Coding | |
| EP0488803B1 (en) | Signal encoding device | |
| JPWO1994007239A1 (en) | Audio encoding method and device | |
| JP3064947B2 (en) | Audio / musical sound encoding and decoding device | |
| US6397176B1 (en) | Fixed codebook structure including sub-codebooks | |
| KR100651712B1 (en) | Wideband speech coder and method thereof and Wideband speech decoder and method thereof | |
| JP3531935B2 (en) | Speech coding method and apparatus | |
| US5864650A (en) | Speech encoding method and apparatus using tree-structure delta code book | |
| KR100465316B1 (en) | Speech encoder and speech encoding method thereof | |
| JP3285185B2 (en) | Acoustic signal coding method | |
| CN116631418B (en) | Voice encoding, decoding methods, devices, computer equipment and storage media | |
| JPH11119800A (en) | Audio encoding / decoding method and audio encoding / decoding device | |
| JP3579276B2 (en) | Audio encoding / decoding method | |
| JP3071012B2 (en) | Audio transmission method | |
| JP4228630B2 (en) | Speech coding apparatus and speech coding program | |
| TWI907896B (en) | Error resilient tools for audio encoding/decoding | |
| JP3489748B2 (en) | Audio encoding device and audio decoding device | |
| CN101223580B (en) | Method and apparatus for searching fixed codebook | |
| JP3010655B2 (en) | Compression encoding apparatus and method, and decoding apparatus and method |