Class TextExtractor
Class TextExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Stellt das TextExtractor-Plugin dar.
public class TextExtractor : PdfExtractor, IPlugin, IDisposable
Vererbung
object ← PdfExtractor ← TextExtractor
Implementiert
Vererbte Mitglieder
PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Beispiele
Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.
// Erstellen Sie ein TextExtractor-Objekt, um Text in PDF-Inhalten zu extrahieren
using (TextExtractor extractor = new TextExtractor())
{
// Erstellen Sie TextExtractorOptions
textExtractorOptions = new TextExtractorOptions();
// Fügen Sie den Pfad zur Eingabedatei zu den Datenquellen hinzu
textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
// Führen Sie den Extraktionsprozess durch
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// Holen Sie den extrahierten Text aus dem ResultContainer-Objekt
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Anmerkungen
Das Aspose.Pdf.Plugins.TextExtractor-Objekt wird verwendet, um Text in PDF-Dokumenten zu extrahieren.
Konstruktoren
TextExtractor()
public TextExtractor()