Class PdfExtractor
Το όνομα: Aspose.Pdf.Plugins Συγκέντρωση: Aspose.PDF.dll (25.4.0)
Αντιπροσωπεύει τη λειτουργικότητα βάσης για την εξαγωγή κειμένου, εικόνων και άλλων τύπων περιεχομένου που μπορεί να εμφανιστούν στις σελίδες των εγγράφων PDF.
public abstract class PdfExtractor : IPlugin, IDisposable
Inheritance
Derived
ImageExtractor , TextExtractor
Implements
Κληρονομημένα μέλη
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
Το παράδειγμα δείχνει πώς να εξαγάγετε περιεχόμενο κειμένου από ένα έγγραφο PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Το αντικείμενο Aspose.Pdf.Plugins.TextExtractor χρησιμοποιείται για την εξόρυξη κειμένου, ή Aspose.Pdf.Plugins.ImageExtractor για την εξόρυξη εικόνων.
Constructors
PdfExtractor()
protected PdfExtractor()
Methods
Dispose()
Εφαρμογή του IDisposable. στην πραγματικότητα, δεν είναι απαραίτητο για το PDFExtractor.
public void Dispose()
Process(IPluginΕπιλογές)
Ξεκινά η επεξεργασία του PdfExtractor με τις καθορισμένες παραμέτρους.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameters
pdfExtractorOptions
IPluginOptions
Ένα αντικείμενο επιλογών που περιέχει οδηγίες για το PDFExtractor.
Returns
Ένα αντικείμενο ResultContainer που περιέχει το αποτέλεσμα της εξόρυξης.