Apache PDFBox - Apache PDFBox
Entwickler | Apache Software Foundation | ||||||
---|---|---|---|---|---|---|---|
Stabile Version |
|
||||||
Repository | PDFBox Repository (Spiegel) | ||||||
Geschrieben in | Java | ||||||
Betriebssystem | Plattformübergreifend | ||||||
Art | Portable Document Format (PDF) | ||||||
Lizenz | Apache License 2.0 | ||||||
Webseite | pdfbox |
Apache PDFBox ist eine Open-Source- Bibliothek mit reinem Java , mit der Text und Metadaten von PDF- Dateien erstellt, gerendert, gedruckt, geteilt, zusammengeführt, geändert, überprüft und extrahiert werden können.
Open Hub meldet über 11.000 Commits (seit dem Start als Apache-Projekt) von 18 Mitwirkenden, die mehr als 140.000 Codezeilen repräsentieren. PDFBox hat eine gut etablierte, ausgereifte von einer durchschnittlichen Größe Entwicklungsteam beibehalten Codebasis mit zunehmender Jahr-über-Jahr verpflichtet. Mit dem COCOMO- Modell wurden schätzungsweise 46 Personenjahre benötigt.
Struktur
Apache PDFBox hat folgende Komponenten:
- PDFBox: der Hauptteil
- FontBox: Behandelt Schriftinformationen
- XmpBox: Behandelt XMP-Metadaten
- Preflight (optional): Überprüft PDF-Dateien auf PDF / A -1b-Konformität.
Geschichte
PDFBox wurde 2002 in SourceForge von Ben Litchfield gestartet, der in der Lage sein wollte, Text von PDF-Dateien für Lucene zu extrahieren . Es wurde 2008 zu einem Apache Incubator- Projekt und 2009 zu einem Apache-Top-Level-Projekt.
Preflight hieß ursprünglich PaDaF und wurde von Atos worldline entwickelt und 2011 für das Projekt gespendet.
Im Februar 2015 wurde Apache PDFBox zur Open Source Partnerorganisation der PDF Association ernannt .