Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Rappresenta le opzioni di estrazione del testo per il plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Ereditarietà

objectPdfExtractorOptionsTextExtractorOptions

Implementa

IPluginOptions

Membri Ereditati

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Esempi

L’esempio dimostra come estrarre il contenuto di testo di un documento PDF.

// crea un oggetto TextExtractor per estrarre i contenuti PDF
using (TextExtractor extractor = new TextExtractor())
{
    // crea un oggetto TextExtractorOptions per impostare il TextFormattingMode (Pure, o Raw - predefinito)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // aggiungi il percorso del file di input alle fonti di dati
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // esegui il processo di estrazione
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ottieni il testo estratto dall'oggetto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Osservazioni

L’oggetto Aspose.Pdf.Plugins.TextExtractorOptions viene utilizzato per impostare Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, stream) che rappresentano documenti PDF di input.

Costruttori

TextExtractorOptions(TextFormattingMode)

Inizializza una nuova istanza dell’oggetto Aspose.Pdf.Plugins.TextExtractorOptions per la modalità di formattazione del testo specificata.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parametri

formattingMode TextExtractorOptions.TextFormattingMode

Valore della modalità di formattazione del testo.

TextExtractorOptions()

Inizializza una nuova istanza dell’oggetto Aspose.Pdf.Plugins.TextExtractorOptions con la modalità di formattazione del testo ‘Raw’ (predefinita).

public TextExtractorOptions()

Proprietà

FormattingMode

Ottiene la modalità di formattazione.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Valore della Proprietà

TextExtractorOptions.TextFormattingMode

OperationName

Restituisce il nome dell’operazione.

public override string OperationName { get; }

Valore della Proprietà

string

 Italiano