Class PdfExtractor

Class PdfExtractor

Navne til: Aspose.Pdf.Plugins Sammensætning: Aspose.PDF.dll (25.4.0)

Det repræsenterer grundfunktionaliteten til at udveksle tekst, billeder og andre typer indhold, der kan forekomme på siderne af PDF-dokumenter.

public abstract class PdfExtractor : IPlugin, IDisposable

Inheritance

object PdfExtractor

Derived

ImageExtractor , TextExtractor

Implements

IPlugin , IDisposable

De arvede medlemmer

object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Examples

Eksemplet viser, hvordan man ekstraherer tekstindhold fra PDF-dokumentet.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();

    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Den Aspose.Pdf.Plugins.TextExtractor objekt bruges til at udveksle tekst, eller Aspose.Pdf.Plugins.ImageExtractor til at udveksle billeder.

Constructors

PdfExtractor()

protected PdfExtractor()

Methods

Dispose()

Implementation af IDisposable. Faktisk er det ikke nødvendigt for PdfExtractor.

public void Dispose()

Process(IPluginoptioner)

Start PdfExtractor-behandling med de angivne parametre.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parameters

pdfExtractorOptions IPluginOptions

Et alternativ objekt, der indeholder instruktioner for PDFExtractor.

Returns

ResultContainer

En ResultContainer-objekt, der indeholder resultatet af ekstraktionen.

 Dansk