Class PdfExtractor

Class PdfExtractor

nazivni prostor: Aspose.Pdf.Plugins Sastav: Aspose.PDF.dll (25.4.0)

Predstavlja osnovnu funkcionalnost za ekstrakciju teksta, slika i drugih vrsta sadržaja koji se mogu pojaviti na stranicama PDF dokumenata.

public abstract class PdfExtractor : IPlugin, IDisposable

Inheritance

object PdfExtractor

Derived

ImageExtractor , TextExtractor

Implements

IPlugin , IDisposable

naslijeđeni članovi

object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Examples

Primjer pokazuje kako izvući tekstni sadržaj iz PDF dokumenta.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();

    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Aspose.Pdf.Plugins.TextExtractor objekt se koristi za ekstrakciju teksta, ili Aspose.Pdf.Plugins.ImageExtractor za ekstrakciju slika.

Constructors

PdfExtractor()

protected PdfExtractor()

Methods

Dispose()

Uvođenje IDisposable. zapravo, to nije potrebno za PdfExtractor.

public void Dispose()

Process(IPluginopcije)

Početak obrade PdfExtractor s određenim parametrima.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parameters

pdfExtractorOptions IPluginOptions

Objekt opcija koji sadrži upute za PDFExtractor.

Returns

ResultContainer

Objekt ResultContainer koji sadrži rezultat ekstrakcije.

 Hrvatski