Class PdfExtractor
De naam: Aspose.Pdf.Plugins Verzameling: Aspose.PDF.dll (25.4.0)
Het vertegenwoordigt de basisfunctie om tekst, afbeeldingen en andere soorten inhoud te extraheren die op de pagina’s van PDF-documenten kunnen optreden.
public abstract class PdfExtractor : IPlugin, IDisposable
Inheritance
Derived
ImageExtractor , TextExtractor
Implements
Geëerbiede leden
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
Het voorbeeld laat zien hoe je tekstinhoud van een PDF-document kunt extraheren.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
De Aspose.Pdf.Plugins.TextExtractor object wordt gebruikt om tekst te extraheren, of Aspose.Pdf.Plugins.ImageExtractor om afbeeldingen te extraheren.
Constructors
PdfExtractor()
protected PdfExtractor()
Methods
Dispose()
Implementatie van IDisposable. in feite is het niet nodig voor PdfExtractor.
public void Dispose()
Process(IPluginopties)
De PdfExtractor-verwerking begint met de aangegeven parameters.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameters
pdfExtractorOptions
IPluginOptions
Een optie object met instructies voor de PdfExtractor.
Returns
Een ResultContainer object dat het resultaat van de extractie bevat.