Class PdfExtractor

Class PdfExtractor

A név: Aspose.Pdf.Plugins Összefoglaló: Aspose.PDF.dll (25.4.0)

Az alapfunkció a szöveg, a képek és más típusú tartalmak kivonására szolgál, amelyek a PDF dokumentumok oldalán előfordulhatnak.

public abstract class PdfExtractor : IPlugin, IDisposable

Inheritance

object PdfExtractor

Derived

ImageExtractor , TextExtractor

Implements

IPlugin , IDisposable

Örökletes tagok

object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Examples

A példa azt mutatja, hogyan lehet kivonni a szöveges tartalmat a PDF dokumentumból.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();

    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Az Aspose.Pdf.Plugins.TextExtractor objektumot használják a szöveg kivonására, vagy az Aspose.Pdf.Plugins.ImageExtractor a képek kivonására.

Constructors

PdfExtractor()

protected PdfExtractor()

Methods

Dispose()

Végrehajtása IDisposable. valójában nem szükséges a PdfExtractor.

public void Dispose()

Process(IPluginOpciók)

Kezdődik a PdfExtractor feldolgozása a meghatározott paraméterekkel.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parameters

pdfExtractorOptions IPluginOptions

Egy opció objektum, amely a PDFExtractor utasításait tartalmazza.

Returns

ResultContainer

Egy ResultContainer objektum, amely tartalmazza a kivonat eredményét.

 Magyar