Class TextExtractor

Class TextExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Stellt das TextExtractor-Plugin dar.

public class TextExtractor : PdfExtractor, IPlugin, IDisposable

Vererbung

objectPdfExtractorTextExtractor

Implementiert

IPlugin, IDisposable

Vererbte Mitglieder

PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Beispiele

Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.

// Erstellen Sie ein TextExtractor-Objekt, um Text in PDF-Inhalten zu extrahieren
using (TextExtractor extractor = new TextExtractor())
{
    // Erstellen Sie TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();

    // Fügen Sie den Pfad zur Eingabedatei zu den Datenquellen hinzu
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));

    // Führen Sie den Extraktionsprozess durch
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // Holen Sie den extrahierten Text aus dem ResultContainer-Objekt
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Anmerkungen

Das Aspose.Pdf.Plugins.TextExtractor-Objekt wird verwendet, um Text in PDF-Dokumenten zu extrahieren.

Konstruktoren

TextExtractor()

public TextExtractor()
 Deutsch