Class PdfExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Rappresenta la funzionalità di base per estrarre testo, immagini e altri tipi di contenuto che possono apparire sulle pagine dei documenti PDF.

public abstract class PdfExtractor : IPlugin, IDisposable

Esempi

L’esempio dimostra come estrarre il contenuto testuale di un documento PDF.

// crea un oggetto TextExtractor per estrarre i contenuti PDF
using (TextExtractor extractor = new TextExtractor())
{
    // crea un oggetto TextExtractorOptions per impostare le istruzioni
    textExtractorOptions = new TextExtractorOptions();

    // aggiungi il percorso del file di input alle fonti di dati
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // esegui il processo di estrazione
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // ottieni il testo estratto dall'oggetto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Osservazioni

L’oggetto Aspose.Pdf.Plugins.TextExtractor viene utilizzato per estrarre testo, o Aspose.Pdf.Plugins.ImageExtractor per estrarre immagini.

Costruttori

PdfExtractor()

protected PdfExtractor()

Metodi

Dispose()

Implementazione di IDisposable. In realtà, non è necessario per PdfExtractor.

public void Dispose()

Process(IPluginOptions)

Avvia il processo di PdfExtractor con i parametri specificati.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parametri

pdfExtractorOptions IPluginOptions

Un oggetto di opzioni contenente istruzioni per il PdfExtractor.

Restituisce

ResultContainer

Un oggetto ResultContainer contenente il risultato dell’estrazione.