Class PdfExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Représente la fonctionnalité de base pour extraire du texte, des images et d’autres types de contenu qui peuvent apparaître sur les pages des documents PDF.
public abstract class PdfExtractor : IPlugin, IDisposable
Héritage
Dérivé
Implémente
Membres hérités
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Exemples
L’exemple démontre comment extraire le contenu textuel d’un document PDF.
// créer un objet TextExtractor pour extraire le contenu PDF
using (TextExtractor extractor = new TextExtractor())
{
// créer un objet TextExtractorOptions pour définir les instructions
textExtractorOptions = new TextExtractorOptions();
// ajouter le chemin du fichier d'entrée aux sources de données
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// effectuer le processus d'extraction
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// obtenir le texte extrait de l'objet ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarques
L’objet Aspose.Pdf.Plugins.TextExtractor est utilisé pour extraire du texte, ou Aspose.Pdf.Plugins.ImageExtractor pour extraire des images.
Constructeurs
PdfExtractor()
protected PdfExtractor()
Méthodes
Dispose()
Implémentation de IDisposable. En fait, ce n’est pas nécessaire pour PdfExtractor.
public void Dispose()
Process(IPluginOptions)
Démarre le traitement de PdfExtractor avec les paramètres spécifiés.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Paramètres
pdfExtractorOptions
IPluginOptions
Un objet d’options contenant des instructions pour le PdfExtractor.
Retourne
Un objet ResultContainer contenant le résultat de l’extraction.