Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Stellt die Optionen zur Textextraktion für das TextExtractor-Plugin dar.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Vererbung

objectPdfExtractorOptionsTextExtractorOptions

Implementiert

IPluginOptions

Vererbte Mitglieder

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Beispiele

Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.

// Erstelle ein TextExtractor-Objekt zur Extraktion von PDF-Inhalten
using (TextExtractor extractor = new TextExtractor())
{
    // Erstelle ein TextExtractorOptions-Objekt, um den TextFormattingMode (Pure oder Raw - Standard) festzulegen
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // Füge den Dateipfad der Eingabedatenquelle hinzu
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // Führe den Extraktionsprozess durch
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // Hole den extrahierten Text aus dem ResultContainer-Objekt
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Anmerkungen

Das Aspose.Pdf.Plugins.TextExtractorOptions-Objekt wird verwendet, um Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode und weitere Optionen für den Textextraktionsvorgang festzulegen.
Außerdem erbt es Funktionen zum Hinzufügen von Daten (Dateien, Streams), die die Eingabe-PDF-Dokumente repräsentieren.

Konstruktoren

TextExtractorOptions(TextFormattingMode)

Initialisiert eine neue Instanz des Aspose.Pdf.Plugins.TextExtractorOptions-Objekts für den angegebenen Textformatierungsmodus.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parameter

formattingMode TextExtractorOptions.TextFormattingMode

Wert des Textformatierungsmodus.

TextExtractorOptions()

Initialisiert eine neue Instanz des Aspose.Pdf.Plugins.TextExtractorOptions-Objekts mit dem ‘Raw’ (Standard) Textformatierungsmodus.

public TextExtractorOptions()

Eigenschaften

FormattingMode

Erhält den Formatierungsmodus.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Eigenschaftswert

TextExtractorOptions.TextFormattingMode

OperationName

Gibt den Namen der Operation zurück.

public override string OperationName { get; }

Eigenschaftswert

string

 Deutsch