Apache PDFBox - Apache PDFBox

PDFBox
Apache PDFBox logo.svg
Entwickler Apache Software Foundation
Stabile Version
1.8.x: 1.8.16 / 5. Oktober 2018 ; vor 2 Jahren  ( 2018-10-05 )
2.0.x: 2.0.23 / 18. März 2021 ; Vor 30 Tagen  ( 2021-03-18 )
3.x: 3.0.0-RC1 / 1 April 2021 ; Vor 16 Tagen  ( 2021-04-01 )
Repository PDFBox Repository (Spiegel)
Geschrieben in Java
Betriebssystem Plattformübergreifend
Art Portable Document Format (PDF)
Lizenz Apache License 2.0
Webseite pdfbox .apache .org

Apache PDFBox ist eine Open-Source- Bibliothek mit reinem Java , mit der Text und Metadaten von PDF- Dateien erstellt, gerendert, gedruckt, geteilt, zusammengeführt, geändert, überprüft und extrahiert werden können.

Open Hub meldet über 11.000 Commits (seit dem Start als Apache-Projekt) von 18 Mitwirkenden, die mehr als 140.000 Codezeilen repräsentieren. PDFBox hat eine gut etablierte, ausgereifte von einer durchschnittlichen Größe Entwicklungsteam beibehalten Codebasis mit zunehmender Jahr-über-Jahr verpflichtet. Mit dem COCOMO- Modell wurden schätzungsweise 46 Personenjahre benötigt.

Struktur

Apache PDFBox hat folgende Komponenten:

  • PDFBox: der Hauptteil
  • FontBox: Behandelt Schriftinformationen
  • XmpBox: Behandelt XMP-Metadaten
  • Preflight (optional): Überprüft PDF-Dateien auf PDF / A -1b-Konformität.

Geschichte

PDFBox wurde 2002 in SourceForge von Ben Litchfield gestartet, der in der Lage sein wollte, Text von PDF-Dateien für Lucene zu extrahieren . Es wurde 2008 zu einem Apache Incubator- Projekt und 2009 zu einem Apache-Top-Level-Projekt.

Preflight hieß ursprünglich PaDaF und wurde von Atos worldline entwickelt und 2011 für das Projekt gespendet.

Im Februar 2015 wurde Apache PDFBox zur Open Source Partnerorganisation der PDF Association ernannt .

Siehe auch

Verweise

Externe Links