Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Stellt die Optionen zur Textextraktion für das TextExtractor-Plugin dar.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Vererbung
object ← PdfExtractorOptions ← TextExtractorOptions
Implementiert
Vererbte Mitglieder
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Beispiele
Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.
// Erstelle ein TextExtractor-Objekt zur Extraktion von PDF-Inhalten
using (TextExtractor extractor = new TextExtractor())
{
// Erstelle ein TextExtractorOptions-Objekt, um den TextFormattingMode (Pure oder Raw - Standard) festzulegen
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// Füge den Dateipfad der Eingabedatenquelle hinzu
extractorOptions.AddInput(new FileDataSource(inputPath));
// Führe den Extraktionsprozess durch
ResultContainer resultContainer = extractor.Process(extractorOptions);
// Hole den extrahierten Text aus dem ResultContainer-Objekt
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Anmerkungen
Das Aspose.Pdf.Plugins.TextExtractorOptions-Objekt wird verwendet, um Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode und weitere Optionen für den Textextraktionsvorgang festzulegen.
Außerdem erbt es Funktionen zum Hinzufügen von Daten (Dateien, Streams), die die Eingabe-PDF-Dokumente repräsentieren.
Konstruktoren
TextExtractorOptions(TextFormattingMode)
Initialisiert eine neue Instanz des Aspose.Pdf.Plugins.TextExtractorOptions-Objekts für den angegebenen Textformatierungsmodus.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parameter
formattingMode
TextExtractorOptions.TextFormattingMode
Wert des Textformatierungsmodus.
TextExtractorOptions()
Initialisiert eine neue Instanz des Aspose.Pdf.Plugins.TextExtractorOptions-Objekts mit dem ‘Raw’ (Standard) Textformatierungsmodus.
public TextExtractorOptions()
Eigenschaften
FormattingMode
Erhält den Formatierungsmodus.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Eigenschaftswert
TextExtractorOptions.TextFormattingMode
OperationName
Gibt den Namen der Operation zurück.
public override string OperationName { get; }