Puls-Code-Modulation - Pulse-code modulation

Puls-Code-Modulation
Dateinamenerweiterung
.L16, .WAV, .AIFF, .AU, .PCM
Internet-Medientyp
Audio/L16, Audio/L8, Audio/L20, Audio/L24
Typschlüssel "AIFF" für L16, keine
magische Zahl Variiert
Formattyp Unkomprimiertes Audio
Enthalten von Audio-CD , AES3 , WAV , AIFF , AU , M2TS , VOB und viele andere

Pulse-Code-Modulation ( PCM ) ist ein Verfahren zur digitalen Darstellung abgetasteter analoger Signale . Es ist die Standardform von digitalem Audio in Computern, CDs , digitaler Telefonie und anderen digitalen Audioanwendungen. In einem PCM- Stream wird die Amplitude des analogen Signals regelmäßig in gleichförmigen Intervallen abgetastet , und jeder Abtastwert wird auf den nächsten Wert innerhalb eines Bereichs digitaler Schritte quantisiert .

Lineare Pulscode-Modulation ( LPCM ) ist eine spezielle Art von PCM, bei der die Quantisierungspegel linear gleichförmig sind. Dies steht im Gegensatz zu PCM-Codierungen, bei denen Quantisierungspegel als Funktion der Amplitude variieren (wie beim A-Law-Algorithmus oder dem μ-Law-Algorithmus ). Obwohl PCM ein allgemeinerer Begriff ist, wird er häufig verwendet, um als LPCM codierte Daten zu beschreiben.

Ein PCM-Stream hat zwei grundlegende Eigenschaften, die die Wiedergabetreue des Streams mit dem ursprünglichen analogen Signal bestimmen: die Abtastrate , dh die Anzahl der Abtastungen pro Sekunde; und die Bittiefe , die die Anzahl möglicher digitaler Werte bestimmt, die verwendet werden können, um jeden Abtastwert darzustellen.

Geschichte

Frühe elektrische Kommunikation begonnen Probe Signale , um Multiplex von mehreren Proben Telegraphie Quellen und sie einen einzigen Telegraphenkabel zu vermitteln über. Der amerikanische Erfinder Moses G. Farmer vermittelte bereits 1853 das Telegrafen -Zeitmultiplexing (TDM). Der Elektroingenieur WM Miner verwendete 1903 einen elektromechanischen Kommutator zum Zeitmultiplexen mehrerer Telegrafensignale; er wandte diese Technologie auch auf die Telefonie an . Er erhielt verständliche Sprache aus Kanälen, die mit einer Frequenz von über 3500–4300 Hz abgetastet wurden; niedrigere Raten erwiesen sich als unbefriedigend.

Im Jahr 1920 verwendete das Kabelbildübertragungssystem von Bartlane die telegrafische Signalisierung von in Papierband gestanzten Zeichen, um auf 5 Stufen quantisierte Bildproben zu senden . Im Jahr 1926 patentierte Paul M. Rainey von Western Electric ein Faksimilegerät, das sein Signal mit 5-Bit-PCM überträgt, das von einem opto-mechanischen Analog-Digital-Wandler codiert wurde . Die Maschine ging nicht in Produktion.

Der britische Ingenieur Alec Reeves , der keine früheren Arbeiten kennt, konzipierte 1937 die Verwendung von PCM für die Sprachkommunikation, während er für International Telephone and Telegraph in Frankreich arbeitete. Er beschrieb die Theorie und ihre Vorteile, aber es ergab sich keine praktische Anwendung. Reeves meldete 1938 ein französisches Patent an und sein US-Patent wurde 1943 erteilt. Zu diesem Zeitpunkt hatte Reeves seine Arbeit im Telekommunikationsforschungsinstitut begonnen .

Die erste Übertragung von Sprache durch digitale Techniken, die SIGSALY Verschlüsselungsgeräte, vermittelt auf hohem Niveau Allied Kommunikation während des Zweiten Weltkriegs . 1943 wurden die Bell Labs- Forscher, die das SIGSALY-System entwickelten, auf die Verwendung der PCM-Binärcodierung aufmerksam, wie sie bereits von Reeves vorgeschlagen wurde. Im Jahr 1949 baute Ferranti Canada für das DATAR- System der kanadischen Marine ein funktionierendes PCM-Funksystem, das in der Lage war, digitalisierte Radardaten über große Entfernungen zu übertragen.

PCM in den späten 1940er und frühen 1950er Jahren verwendete eine Kathodenstrahl- Codierungsröhre mit einer Plattenelektrode mit Codierungsperforationen. Wie bei einem Oszilloskop wurde der Strahl mit der Abtastrate horizontal geschwenkt, während die vertikale Ablenkung durch das analoge Eingangssignal gesteuert wurde, was bewirkte, dass der Strahl höhere oder niedrigere Abschnitte der perforierten Platte passierte. Die Platte sammelte oder passierte den Strahl und erzeugte Bit für Bit Stromvariationen im Binärcode. Anstelle einer natürlichen Binärdatei wurde das Gitter der späteren Goodall-Röhre perforiert, um einen störungsfreien Gray-Code zu erzeugen, und erzeugte alle Bits gleichzeitig, indem ein Fächerstrahl anstelle eines Abtaststrahls verwendet wurde.

In den Vereinigten Staaten, die National Inventors Hall of Fame hat geehrt Bernard M. Oliver und Claude Shannon als Erfinder von PCM, wie in "Kommunikationssystem Pulse Code Modulation", beschrieben US - Patent 2.801.281 , eingereicht in den Jahren 1946 und 1952 im Jahr 1956 gewährt Ein weiteres Patent mit demselben Titel wurde 1945 von John R. Pierce angemeldet und 1948 ausgestellt: US-Patent 2,437,707 . Die drei veröffentlichten 1948 "The Philosophy of PCM".

Das 1961 eingeführte T-Trägersystem verwendet zwei verdrillte Übertragungsleitungen, um 24 PCM- Telefongespräche zu übertragen, die mit 8 kHz und 8-Bit-Auflösung abgetastet werden. Diese Entwicklung verbesserte die Kapazität und die Anrufqualität im Vergleich zu den früheren Frequenzmultiplexverfahren .

1973 wurde von P. Cummiskey, Nikil Jayant und James L. Flanagan die adaptive differentielle Puls-Code-Modulation (ADPCM) entwickelt .

Digitale Audioaufnahmen

1967 wurde der erste PCM-Recorder von den Forschungseinrichtungen von NHK in Japan entwickelt. Das 30-kHz-12-Bit-Gerät verwendet einen Kompander (ähnlich DBX Noise Reduction ), um den Dynamikbereich zu erweitern, und speichert die Signale auf einem Videorecorder . 1969 erweiterte NHK die Fähigkeiten des Systems auf 2-Kanal- Stereo und 32 kHz 13-Bit-Auflösung. Im Januar 1971 nahmen Ingenieure bei Denon mit dem PCM-Aufzeichnungssystem von NHK die ersten kommerziellen digitalen Aufzeichnungen auf.

1972 stellte Denon den ersten 8-Kanal-Digitalrekorder vor, den DN-023R, der einen 4-Kopf-Open-Reel-Broadcast-Videobandrekorder verwendet, um in 47,25 kHz, 13-Bit-PCM-Audio aufzuzeichnen. 1977 entwickelte Denon das tragbare PCM-Aufzeichnungssystem DN-034R. Wie der DN-023R zeichnete er 8 Kanäle bei 47,25 kHz auf, verwendete jedoch 14 Bit "mit Betonung" , was 15,5 Bit entspricht.

1979 wurde das erste digitale Pop-Album Bop till You Drop aufgenommen. Es wurde in 50 kHz, 16-Bit-Linear-PCM unter Verwendung eines 3M-Digitalbandgeräts aufgezeichnet.

Die Compact Disc (CD) brachte PCM mit ihrer Einführung im Jahr 1982 in Consumer-Audioanwendungen. Die CD verwendet eine Abtastfrequenz von 44.100 Hz und eine 16-Bit-Auflösung und speichert bis zu 80 Minuten Stereo-Audio pro Disc.

Digitale Telefonie

Die schnelle Entwicklung und weite Verbreitung von PCM digitaler Telefonie durch aktiviert wurden Metall-Oxid-Halbleiter (MOS) geschalteten Kondensator (SC) Schaltungstechnik, in den frühen 1970er Jahren entwickelt. Dies führte Ende der 1970er Jahre zur Entwicklung von PCM-Codec-Filterchips. Der von David A. Hodges und WC Black im Jahr 1980 entwickelte PCM-Codec-Filter-Chip mit Silizium-Gate- CMOS (complementary MOS) ist seitdem der Industriestandard für die digitale Telefonie. In den 1990er Jahren wurden Telekommunikationsnetze wie das öffentliche Telefonnetz (PSTN) weitgehend mit CMOS-PCM-Codec-Filtern mit sehr großer Integration (VLSI) digitalisiert , die in elektronischen Vermittlungssystemen für Telefonzentralen und benutzerseitige Modems weit verbreitet sind und eine breite Palette von digitalen Übertragungsanwendungen , wie das dienstintegrierte digitale Netz (ISDN), schnurlose Telefone und Mobiltelefone .

Implementierungen

PCM ist die Codierungsmethode, die normalerweise für unkomprimiertes digitales Audio verwendet wird.

  • Die 4ESS-Vermittlung führte 1976 die Zeitmultiplexvermittlung in das US-Telefonsystem ein, basierend auf der Technologie mittlerer integrierter Schaltungen.
  • LPCM wird für die verlustfreie Kodierung von Audiodaten in dem 1982 eingeführten Compact Disc Red Book Standard (informell auch als Audio CD bekannt ) verwendet.
  • AES3 (spezifiziert 1985, auf dem S/PDIF basiert) ist ein spezielles Format, das LPCM verwendet.
  • LaserDiscs mit digitalem Ton haben eine LPCM-Spur auf dem digitalen Kanal.
  • Auf PCs beziehen sich PCM und LPCM oft auf das Format, das in WAV (definiert im Jahr 1991) und AIFF- Audio-Container-Formaten (definiert im Jahr 1988) verwendet wird. LPCM-Daten können auch in anderen Formaten wie AU , Rohaudioformat (Datei ohne Header) und verschiedenen Multimedia- Containerformaten gespeichert werden .
  • LPCM ist als Teil der DVD- (seit 1995) und Blu-ray- (seit 2006) Standards definiert. Es wird auch als Teil verschiedener digitaler Video- und Audiospeicherformate definiert (zB DV seit 1995, AVCHD seit 2006).
  • LPCM wird von HDMI (definiert im Jahr 2002) verwendet, einer digitalen Audio-/Video-Anschlussschnittstelle mit einem einzigen Kabel zur Übertragung unkomprimierter digitaler Daten.
  • Das RF64- Containerformat (definiert im Jahr 2007) verwendet LPCM und ermöglicht auch die Nicht-PCM-Bitstream-Speicherung: verschiedene in der RF64-Datei als Datenbursts enthaltene Kompressionsformate (Dolby E, Dolby AC3, DTS, MPEG-1/MPEG-2 Audio) können "verkleidet" als PCM-Linear.

Modulation

Abtastung und Quantisierung eines Signals (rot) für 4-bit LPCM

Im Diagramm wird eine Sinuswelle (rote Kurve) abgetastet und für PCM quantisiert. Die Sinuswelle wird in regelmäßigen Abständen abgetastet, dargestellt als vertikale Linien. Für jede Probe wird einer der verfügbaren Werte (auf der y-Achse) ausgewählt. Der PCM-Prozess wird üblicherweise auf einer einzigen integrierten Schaltung implementiert , die als Analog-Digital-Wandler (ADC) bezeichnet wird. Dies erzeugt eine vollständig diskrete Darstellung des Eingangssignals (blaue Punkte), die leicht als digitale Daten zur Speicherung oder Manipulation kodiert werden kann. Mehrere Ströme PCM auch in einen größeren Aggregat gemultiplext werden könnten Datenstrom , in der Regel für die Übertragung von mehreren Strömen über eine einzige physikalische Verbindung. Eine Technik wird Zeitmultiplex (TDM) genannt und ist weit verbreitet, insbesondere im modernen öffentlichen Telefonsystem.

Demodulation

Die Elektronik, die an der Erzeugung eines genauen Analogsignals aus den diskreten Daten beteiligt ist, ist ähnlich derjenigen, die zum Erzeugen des Digitalsignals verwendet wird. Diese Geräte sind Digital-Analog-Wandler (DACs). Sie erzeugen eine Spannung oder einen Strom (je nach Typ), der den Wert darstellt, der an ihren digitalen Eingängen angezeigt wird. Diese Ausgabe würde dann im Allgemeinen gefiltert und zur Verwendung verstärkt.

Um das Originalsignal aus den abgetasteten Daten wiederherzustellen, kann ein Demodulator das Modulationsverfahren in umgekehrter Richtung anwenden. Nach jeder Abtastperiode liest der Demodulator den nächsten Wert und überführt das Ausgangssignal auf den neuen Wert. Als Ergebnis dieser Übergänge behält das Signal aufgrund von Abbildungseffekten eine beträchtliche Menge an Hochfrequenzenergie. Um diese unerwünschten Frequenzen zu entfernen, leitet der Demodulator das Signal durch einen Rekonstruktionsfilter , der Energie außerhalb des erwarteten Frequenzbereichs (größer als die Nyquist-Frequenz ) unterdrückt .

Standard-Sampling-Präzision und -Raten

Übliche Abtasttiefen für LPCM sind 8, 16, 20 oder 24 Bit pro Abtastung .

LPCM kodiert einen einzelnen Tonkanal. Die Unterstützung für Mehrkanal-Audio hängt vom Dateiformat ab und beruht auf der Synchronisierung mehrerer LPCM-Streams. Während zwei Kanäle (Stereo) das gängigste Format sind, können Systeme bis zu 8 Audiokanäle (7.1 Surround) oder mehr unterstützen.

Übliche Abtastfrequenzen sind 48 kHz, wie sie bei Videos im DVD- Format verwendet werden, oder 44,1 kHz, wie sie bei CDs verwendet werden. Bei einigen Geräten können Abtastfrequenzen von 96 kHz oder 192 kHz verwendet werden, aber die Vorteile wurden diskutiert.

Einschränkungen

Das Nyquist-Shannon-Abtasttheorem zeigt, dass PCM-Geräte ohne das Einführen von Verzerrungen in ihre entworfenen Frequenzbänder arbeiten können, wenn sie eine Abtastfrequenz liefern, die mindestens doppelt so hoch ist wie die höchste im Eingangssignal enthaltene Frequenz. Zum Beispiel in Telefonie , die nutzbaren Sprachfrequenzbereiche Band von etwa 300  Hz bis 3400 Hz. Für eine effektive Rekonstruktion des Sprachsignals verwenden Telefonanwendungen daher typischerweise eine Abtastfrequenz von 8000 Hz, die mehr als das Doppelte der höchsten verwendbaren Sprachfrequenz ist.

Unabhängig davon gibt es in jedem PCM-System potenzielle Quellen für Beeinträchtigungen:

  • Die Wahl eines diskreten Wertes, der für jeden Abtastwert nahe, aber nicht genau dem analogen Signalpegel liegt, führt zu einem Quantisierungsfehler .
  • Zwischen den Abtastungen wird keine Messung des Signals durchgeführt; das Abtasttheorem garantiert eine eindeutige Darstellung und Wiederherstellung des Signals nur dann, wenn es keine Energie bei der Frequenz f s /2 oder höher (eine halbe Abtastfrequenz, bekannt als Nyquist-Frequenz ) hat; höhere Frequenzen werden nicht korrekt dargestellt oder wiederhergestellt und fügen dem Signal unterhalb der Nyquist-Frequenz eine Aliasing-Verzerrung hinzu.
  • Da Samples zeitabhängig sind, ist für eine genaue Wiedergabe eine genaue Uhr erforderlich. Wenn entweder der Codierungs- oder Decodierungstakt nicht stabil ist, wirken sich diese Mängel direkt auf die Ausgabequalität des Geräts aus.

Verarbeitung und Codierung

Einige Formen von PCM kombinieren Signalverarbeitung mit Codierung. Ältere Versionen dieser Systeme wendeten die Verarbeitung im analogen Bereich als Teil des Analog-Digital-Prozesses an; neuere Implementierungen tun dies im digitalen Bereich. Diese einfachen Techniken sind durch moderne, auf Transformationen basierende Audiokompressionstechniken , wie beispielsweise modifizierte diskrete Kosinustransformations- (MDCT)-Codierung, weitgehend obsolet geworden .

  • Linear PCM (LPCM) ist PCM mit linearer Quantisierung.
  • Differentielles PCM (DPCM) codiert die PCM-Werte als Differenzen zwischen dem aktuellen und dem vorhergesagten Wert. Ein Algorithmus sagt den nächsten Abtastwert basierend auf den vorherigen Abtastwerten vorher, und der Encoder speichert nur die Differenz zwischen dieser Vorhersage und dem tatsächlichen Wert. Wenn die Vorhersage vernünftig ist, können weniger Bits verwendet werden, um die gleichen Informationen darzustellen. Für Audio reduziert diese Art der Codierung die Anzahl der erforderlichen Bits pro Abtastung um etwa 25 % im Vergleich zu PCM.
  • Adaptive differentielle Puls-Code-Modulation (ADPCM) ist eine Variante von DPCM, die die Größe des Quantisierungsschritts variiert, um eine weitere Reduzierung der erforderlichen Bandbreite für ein gegebenes Signal-Rausch-Verhältnis zu ermöglichen .
  • Delta-Modulation ist eine Form von DPCM, die ein Bit pro Abtastwert verwendet, um anzuzeigen, ob das Signal im Vergleich zum vorherigen Abtastwert zu- oder abnimmt.

In der Telefonie wird ein Standard-Audiosignal für einen einzelnen Telefonanruf als 8.000 Abtastungen pro Sekunde mit jeweils 8 Bit codiert , was ein digitales 64-kbit/s-Signal ergibt, das als DS0 bekannt ist . Die Standardcodierung der Signalkompression auf einem DS0 ist entweder μ-law (mu-law) PCM (Nordamerika und Japan) oder A-law PCM (Europa und der Rest der Welt). Dies sind logarithmische Kompressionssysteme, bei denen eine lineare 12- oder 13-Bit-PCM-Abtastwertnummer in einen 8-Bit-Wert abgebildet wird. Dieses System wird durch den internationalen Standard G.711 beschrieben .

Bei hohen Schaltungskosten und akzeptablen Sprachverlusten ist es manchmal sinnvoll, das Sprachsignal noch weiter zu komprimieren. Ein ADPCM-Algorithmus wird verwendet, um eine Reihe von 8-Bit-μ-law- oder A-law-PCM-Abtastwerten in eine Reihe von 4-Bit-ADPCM-Abtastwerten abzubilden. Auf diese Weise wird die Kapazität der Linie verdoppelt. Die Technik ist im G.726- Standard detailliert beschrieben .

Audiocodierformate und Audiocodecs wurden entwickelt, um eine weitere Komprimierung zu erreichen. Einige dieser Techniken wurden standardisiert und patentiert. Moderne Komprimierungstechniken wie MDCT und Linear Predictive Coding (LPC) werden heute häufig in Mobiltelefonen , Voice over IP (VoIP) und Streaming Media eingesetzt .

Codierung für serielle Übertragung

PCM kann entweder Return-to-Zero (RZ) oder Non-Return-to-Zero (NRZ) sein. Damit ein NRZ-System unter Verwendung von Inband-Information synchronisiert wird, dürfen keine langen Folgen identischer Symbole, wie beispielsweise Einsen oder Nullen, vorhanden sein. Bei binären PCM-Systemen wird die Dichte von 1-Symbolen als Einerdichte bezeichnet .

Ones-Dichte gesteuert wird oft Vorcodierung Techniken wie -Laufzeitlängenbegrenzung- Codierung, wobei der PCM - Codes in einer etwas längeren Code erweitert ist mit einem auf diejenigen Dichte vor der Modulation in den Kanal gebunden garantiert. In anderen Fällen werden dem Stream zusätzliche Framing-Bits hinzugefügt, was zumindest gelegentliche Symbolübergänge garantiert.

Eine andere Technik, die verwendet wird, um die Einsendichte zu steuern, ist die Verwendung eines Verwürflers für die Daten, der dazu neigt, den Datenstrom in einen Strom zu verwandeln, der pseudozufällig aussieht , bei dem die Daten jedoch durch einen komplementären Entwürfler genau wiederhergestellt werden können. In diesem Fall sind am Ausgang noch lange Null- oder Einsenserien möglich, die jedoch als unwahrscheinlich genug angesehen werden, um eine zuverlässige Synchronisation zu ermöglichen.

In anderen Fällen ist der Langzeit-DC-Wert des modulierten Signals wichtig, da der Aufbau einer DC-Vorspannung dazu neigt, Kommunikationsschaltungen aus ihrem Betriebsbereich zu bewegen. In diesem Fall werden spezielle Maßnahmen ergriffen, um eine Zählung der kumulativen DC-Vorspannung zu führen und die Codes erforderlichenfalls zu modifizieren, damit die DC-Vorspannung immer auf Null zurückgeht.

Viele dieser Codes sind bipolare Codes , bei denen die Impulse positiv, negativ oder nicht vorhanden sein können. Bei dem typischen Wechselmarkierungs-Inversionscode wechseln Impulse, die nicht Null sind, zwischen positiv und negativ ab. Diese Regeln können verletzt werden, um spezielle Symbole zu erzeugen, die für Framing oder andere spezielle Zwecke verwendet werden.

Nomenklatur

Das Wort Puls im Begriff Puls-Code-Modulation bezeichnet die Pulse, die in der Übertragungsleitung zu finden sind. Dies ist vielleicht eine natürliche Folge dieser Technik, die sich neben zwei analogen Verfahren entwickelt hat, der Pulsbreitenmodulation und der Pulspositionsmodulation , bei denen die zu codierende Information durch diskrete Signalimpulse unterschiedlicher Breite bzw. Position repräsentiert wird. In dieser Hinsicht hat PCM wenig Ähnlichkeit mit diesen anderen Formen der Signalcodierung, außer dass alle beim Zeitmultiplexen verwendet werden können und die Anzahl der PCM-Codes als elektrische Impulse dargestellt werden.

Siehe auch

Anmerkungen

Verweise

Weiterlesen

Externe Links