Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Représente les options d’extraction de texte pour le plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Héritage

objectPdfExtractorOptionsTextExtractorOptions

Implémente

IPluginOptions

Membres Hérités

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Exemples

L’exemple démontre comment extraire le contenu textuel d’un document PDF.

// créer un objet TextExtractor pour extraire le contenu PDF
using (TextExtractor extractor = new TextExtractor())
{
    // créer un objet TextExtractorOptions pour définir TextFormattingMode (Pur ou Brut - par défaut)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // ajouter le chemin du fichier d'entrée aux sources de données
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // effectuer le processus d'extraction
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // obtenir le texte extrait de l'objet ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarques

L’objet Aspose.Pdf.Plugins.TextExtractorOptions est utilisé pour définir Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode et d’autres options pour l’opération d’extraction de texte.
De plus, il hérite des fonctions pour ajouter des données (fichiers, flux) représentant des documents PDF d’entrée.

Constructeurs

TextExtractorOptions(TextFormattingMode)

Initialise une nouvelle instance de l’objet Aspose.Pdf.Plugins.TextExtractorOptions pour le mode de formatage de texte spécifié.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Paramètres

formattingMode TextExtractorOptions.TextFormattingMode

Valeur du mode de formatage de texte.

TextExtractorOptions()

Initialise une nouvelle instance de l’objet Aspose.Pdf.Plugins.TextExtractorOptions avec le mode de formatage de texte ‘Brut’ (par défaut).

public TextExtractorOptions()

Propriétés

FormattingMode

Obtient le mode de formatage.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Valeur de la Propriété

TextExtractorOptions.TextFormattingMode

OperationName

Renvoie le nom de l’opération.

public override string OperationName { get; }

Valeur de la Propriété

string

 Français