Internationalisierung und Lokalisierung - Internationalization and localization

Screenshot von TDE- Softwareprogrammen, die hauptsächlich auf Chinesisch (traditionell) lokalisiert sind .

In der Informatik sind Internationalisierung und Lokalisierung ( amerikanisch ) oder Internationalisierung und Lokalisierung ( BrE ), oft abgekürzt i18n und L10n, Mittel zur Anpassung von Computersoftware an unterschiedliche Sprachen, regionale Besonderheiten und technische Anforderungen eines Zielgebietsschemas. Internationalisierung ist der Prozess, eine Softwareanwendung so zu gestalten, dass sie ohne technische Änderungen an verschiedene Sprachen und Regionen angepasst werden kann. Lokalisierung ist der Prozess der internationalisierten Software für eine bestimmte Region oder Sprache Anpassung von Text zu übersetzen und das Hinzufügen von locale -spezifische Komponenten. Die Lokalisierung (die möglicherweise mehrmals für verschiedene Länder durchgeführt wird) nutzt die Infrastruktur oder Flexibilität der Internationalisierung (die idealerweise nur einmal vor der Lokalisierung oder als integraler Bestandteil der laufenden Entwicklung durchgeführt wird).

Benennung

Die Begriffe werden häufig mit den Numeronymen i18n (wobei 18 für die Anzahl der Buchstaben zwischen dem ersten i und dem letzten n im Wort Internationalisierung steht , eine Verwendung, die in den 1970er oder 1980er Jahren bei der Digital Equipment Corporation geprägt wurde ) und L10n für Lokalisierung , Due . abgekürzt auf die Länge der Wörter. Einige Autoren haben das letztere Akronym großgeschrieben, um die beiden zu unterscheiden.

Einige Unternehmen wie IBM und Oracle verwenden den Begriff Globalisierung , g11n , für die Kombination von Internationalisierung und Lokalisierung.

Microsoft definiert Internationalisierung als eine Kombination aus World-Readiness und Lokalisierung. World-Readiness ist eine Entwickleraufgabe, die es ermöglicht, ein Produkt mit mehreren Skripten und Kulturen zu verwenden (Globalisierung) und die Ressourcen der Benutzeroberfläche in ein lokalisierbares Format zu trennen (Lokalisierbarkeit, abgekürzt L12y ).

Hewlett-Packard und HP-UX haben ein System namens "National Language Support" oder "Native Language Support" (NLS) entwickelt, um lokalisierbare Software zu erstellen.

Umfang

Der Internationalisierungs- und Lokalisierungsprozess
(basierend auf einem Diagramm von der LISA- Website)

Laut Software ohne Grenzen sind die bei der Internationalisierung eines Produkts zu berücksichtigenden Designaspekte "Datencodierung, Daten und Dokumentation, Softwarekonstruktion, Hardwaregeräteunterstützung, Benutzerinteraktion"; während die wichtigsten Designbereiche, die bei der Erstellung eines vollständig internationalisierten Produkts von Grund auf zu berücksichtigen sind, "Benutzerinteraktion, Algorithmusdesign und Datenformate, Softwaredienste, Dokumentation" sind.

Die Übersetzung ist in der Regel die zeitaufwendigste Komponente der Sprachlokalisierung . Dies kann beinhalten:

  • Für Film, Video und Audio, Übersetzung von gesprochenen Wörtern oder Musiktexten, oft mit Synchronisation oder Untertiteln
  • Textübersetzung für Printmedien, digitale Medien (ggf. inkl. Fehlermeldungen und Dokumentation)
  • Möglicherweise ändern Sie Bilder und Logos, die Text enthalten, um Übersetzungen oder allgemeine Symbole zu enthalten
  • Unterschiedliche Übersetzungslängen und unterschiedliche Zeichengrößen (z. B. zwischen lateinischen Buchstaben und chinesischen Zeichen ) können dazu führen, dass Layouts, die in einer Sprache gut funktionieren, in anderen schlecht funktionieren
  • Berücksichtigung von Dialekt- , Register- oder Varietätsunterschieden
  • Schreibkonventionen wie:

Standardgebietsschemadaten

Computersoftware kann über die einfache Übersetzung von Wörtern und Phrasen hinaus auf Unterschiede stoßen, da Computerprogramme Inhalte dynamisch generieren können. Diese Unterschiede müssen möglicherweise im Internationalisierungsprozess zur Vorbereitung der Übersetzung berücksichtigt werden. Viele dieser Unterschiede sind so regelmäßig, dass eine Konvertierung zwischen den Sprachen leicht automatisiert werden kann. Das Common Locale Data Repository von Unicode bietet eine Sammlung solcher Unterschiede. Seine Daten werden von großen Betriebssystemen wie Microsoft Windows , macOS und Debian sowie von großen Internetunternehmen oder Projekten wie Google und der Wikimedia Foundation verwendet . Beispiele für solche Unterschiede sind:

  • Unterschiedliche "Schriften" in unterschiedlichen Schriftsystemen verwenden unterschiedliche Zeichen – unterschiedliche Buchstaben, Syllogramme, Logogramme oder Symbole. Moderne Systeme verwenden den Unicode- Standard, um viele verschiedene Sprachen mit einer einzigen Zeichencodierung darzustellen .
  • Die Schreibrichtung ist in den meisten europäischen Sprachen von links nach rechts, in Hebräisch und Arabisch von rechts nach links oder in Boustrophedon- Schriften beides und in einigen asiatischen Sprachen optional vertikal.
  • Komplexes Textlayout , für Sprachen, in denen Zeichen die Form je nach Kontext ändern
  • In einigen Skripten gibt es Groß- und Kleinschreibung, in anderen nicht
  • Unterschiedliche Sprachen und Schriftsysteme haben unterschiedliche Regeln zur Textsortierung
  • Verschiedene Sprachen haben unterschiedliche Zahlensysteme , die möglicherweise unterstützt werden müssen, wenn keine westarabischen Zahlen verwendet werden
  • Unterschiedliche Sprachen haben unterschiedliche Pluralisierungsregeln, was Programme verkomplizieren kann, die numerische Inhalte dynamisch anzeigen. Andere Grammatikregeln können ebenfalls variieren, zB Genitiv .
  • Verschiedene Sprachen verwenden unterschiedliche Satzzeichen (z. B. Zitieren von Text mit doppelten Anführungszeichen (" ") wie im Englischen oder Guillemets (« ») wie im Französischen)
  • Tastaturkürzel können nur Schaltflächen verwenden, die sich tatsächlich auf dem Tastaturlayout befinden, für das lokalisiert wird. Wenn ein Shortcut einem Wort in einer bestimmten Sprache entspricht (zB Strg-s steht für "save" im Englischen), muss es möglicherweise geändert werden.

Nationale Konventionen

Verschiedene Länder haben unterschiedliche Wirtschaftskonventionen, einschließlich Variationen in:

Insbesondere die Vereinigten Staaten und Europa unterscheiden sich in den meisten dieser Fälle. Andere Bereiche folgen oft einem von diesen.

Bestimmte Dienste von Drittanbietern wie Online-Karten, Wetterberichte oder Zahlungsdienstleister sind möglicherweise nicht oder nicht weltweit von denselben Mobilfunkanbietern verfügbar.

Zeitzonen sind weltweit unterschiedlich, und dies muss berücksichtigt werden, wenn ein Produkt ursprünglich nur mit Menschen in einer einzigen Zeitzone interagiert hat. Für die Internationalisierung wird UTC oft intern verwendet und dann zu Anzeigezwecken in eine lokale Zeitzone umgerechnet.

Unterschiedliche Länder haben unterschiedliche rechtliche Anforderungen, das heißt zum Beispiel:

Bei der Lokalisierung können auch kulturelle Unterschiede berücksichtigt werden, wie zum Beispiel:

Geschäftsprozess zur Internationalisierung von Software

Um ein Produkt zu internationalisieren , ist es wichtig, eine Vielzahl von Märkten zu betrachten, in die das Produkt voraussichtlich eintreten wird. Details wie Feldlänge für Straßenadressen, eindeutiges Format für die Adresse, Möglichkeit, das Postleitzahlenfeld optional zu machen, um Länder ohne Postleitzahlen anzusprechen, oder das Bundeslandfeld für Länder, die keine Bundesstaaten haben, sowie die Einführung einer neuen Registrierung Abläufe, die den lokalen Gesetzen entsprechen, sind nur einige der Beispiele, die Internationalisierung zu einem komplexen Projekt machen. Ein breiterer Ansatz berücksichtigt kulturelle Faktoren, beispielsweise die Anpassung der Geschäftsprozesslogik oder die Einbeziehung individueller kultureller (Verhaltens-)Aspekte.

Bereits in den 1990er Jahren nutzten Unternehmen wie Bull die maschinelle Übersetzung ( Systran ) in großem Umfang für ihre gesamte Übersetzungstätigkeit: Menschliche Übersetzer übernahmen das Pre-Editing (Machen der Eingabe maschinenlesbar) und das Post-Editing .

Maschinenbau

Sowohl beim Re-Engineering einer bestehenden Software als auch beim Entwerfen einer neuen internationalisierten Software besteht der erste Schritt der Internationalisierung darin, jeden potenziell gebietsschemaabhängigen Teil (ob Code, Text oder Daten) in ein separates Modul aufzuteilen. Jedes Modul kann dann entweder auf eine Standardbibliothek/-abhängigkeit zurückgreifen oder nach Bedarf für jedes Gebietsschema unabhängig ersetzt werden.

Die gegenwärtig vorherrschende Praxis besteht darin, dass Anwendungen Text in Ressourcenzeichenfolgen platzieren, die bei Bedarf während der Programmausführung geladen werden. Diese in Ressourcendateien gespeicherten Strings sind relativ einfach zu übersetzen. Abhängig von den ausgewählten Gebietsschemadaten werden häufig Programme erstellt, um auf Ressourcenbibliotheken zu verweisen.

Der Speicher für übersetzbare und übersetzte Zeichenfolgen wird manchmal als Nachrichtenkatalog bezeichnet, da die Zeichenfolgen als Nachrichten bezeichnet werden. Der Katalog umfasst im Allgemeinen einen Satz von Dateien in einem bestimmten Lokalisierungsformat und eine Standardbibliothek zur Handhabung dieses Formats. Eine Softwarebibliothek und ein Format, das dies unterstützt, ist gettext .

Um also eine Anwendung dazu zu bringen, mehrere Sprachen zu unterstützen, würde man die Anwendung so gestalten, dass sie die relevante Sprachressourcendatei zur Laufzeit auswählt. Der Code, der zum Verwalten der Überprüfung der Dateneingabe und vieler anderer gebietsschemasensibler Datentypen erforderlich ist, muss auch unterschiedliche Gebietsschemaanforderungen unterstützen. Moderne Entwicklungssysteme und Betriebssysteme enthalten ausgefeilte Bibliotheken für die internationale Unterstützung dieser Typen, siehe auch Standard-Locale-Daten oben.

Viele Lokalisierungsprobleme (zB Schreibrichtung, Textsortierung) erfordern tiefgreifendere Änderungen in der Software als die Textübersetzung. Zum Beispiel OpenOffice.org erreicht dies mit Kompilation Schalter.

Verfahren

Eine Globalisierungsmethode umfasst nach der Planung drei Umsetzungsschritte: Internationalisierung, Lokalisierung und Qualitätssicherung.

Zu einem gewissen Grad (zB für die Qualitätssicherung ) besteht in den Entwicklungsteams jemand, der die grundlegenden/zentralen Phasen des Prozesses übernimmt, die dann alle anderen ermöglichen. Solche Personen verstehen typischerweise fremde Sprachen und Kulturen und haben einen gewissen technischen Hintergrund. Spezialisierte technische Redakteure sind erforderlich, um eine kulturell angemessene Syntax für potenziell komplizierte Konzepte zu erstellen, verbunden mit technischen Ressourcen, um die Lokalisierungselemente bereitzustellen und zu testen.

Sobald Software richtig internationalisiert ist, kann sie auf dezentralere Lokalisierungsmodelle zurückgreifen: Freie und Open-Source-Software basieren normalerweise auf der Selbstlokalisierung durch Endbenutzer und Freiwillige, die manchmal in Teams organisiert sind. Das KDE3- Projekt beispielsweise wurde in über 100 Sprachen übersetzt; MediaWiki in 270 Sprachen, davon 100 größtenteils vollständig, Stand 2016.

Bei der Übersetzung vorhandener Texte in andere Sprachen ist es schwierig, die parallelen Versionen von Texten während der gesamten Lebensdauer des Produkts aufrechtzuerhalten. Wenn beispielsweise eine dem Benutzer angezeigte Nachricht geändert wird, müssen alle übersetzten Versionen geändert werden.

Kommerzielle Erwägungen

In einem kommerziellen Umfeld ist der Vorteil der Lokalisierung der Zugang zu mehr Märkten. In den frühen 1980er Jahren brauchte Lotus 1-2-3 zwei Jahre, um Programmcode und Text zu trennen und verlor die Marktführerschaft in Europa gegenüber Microsoft Multiplan . MicroPro stellte fest, dass die Verwendung eines österreichischen Übersetzers für den westdeutschen Markt dazu führte, dass die WordStar- Dokumentation, sagte ein Manager, nicht "den Ton hatte, den sie hätte haben sollen".

Allerdings sind damit erhebliche Kosten verbunden, die weit über das Engineering hinausgehen. Darüber hinaus müssen sich die Geschäftsabläufe anpassen, um die Produktion, Lagerung und den Vertrieb mehrerer diskreter lokalisierter Produkte zu verwalten, die oft in völlig unterschiedlichen Währungen, regulatorischen Umgebungen und Steuersystemen verkauft werden.

Schließlich müssen Vertrieb, Marketing und technischer Support auch ihre eigenen Abläufe in den neuen Sprachen erleichtern, um die Kunden für die lokalisierten Produkte zu unterstützen. Insbesondere für relativ kleine Sprachpopulationen ist es möglicherweise nie wirtschaftlich, ein lokalisiertes Produkt anzubieten. Selbst wenn eine große Sprachpopulation eine Lokalisierung für ein bestimmtes Produkt rechtfertigen könnte und die interne Struktur eines Produkts bereits eine Lokalisierung zulässt, fehlt einem bestimmten Softwareentwickler oder -herausgeber möglicherweise die Größe und die Raffinesse, um die Zusatzfunktionen zu verwalten, die mit dem Betrieb in mehreren Gebietsschemas verbunden sind.

Siehe auch

Verweise

Weiterlesen

  • .NET Internationalization: The Developer's Guide to Building Global Windows and Web Applications , Guy Smith-Ferrier, Addison-Wesley Professional, 7. August 2006. ISBN  0-321-34138-4
  • Ein praktischer Leitfaden zur Lokalisierung , Bert Esselink, John Benjamins Publishing, [2000]. ISBN  1-58811-006-0
  • Lydia Ash : The Web Testing Companion: The Insider's Guide to Efficient and Effective Tests , Wiley, 2. Mai 2003. ISBN  0-471-43021-8
  • Geschäft ohne Grenzen: Ein strategischer Leitfaden für globales Marketing , Donald A. DePalma, Globa Vista Press [2004]. ISBN  978-0-9765169-0-3

Externe Links