Class PdfExtractor
nazivni prostor: Aspose.Pdf.Plugins Sastav: Aspose.PDF.dll (25.4.0)
Predstavlja osnovnu funkcionalnost za ekstrakciju teksta, slika i drugih vrsta sadržaja koji se mogu pojaviti na stranicama PDF dokumenata.
public abstract class PdfExtractor : IPlugin, IDisposable
Inheritance
Derived
ImageExtractor , TextExtractor
Implements
naslijeđeni članovi
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
Primjer pokazuje kako izvući tekstni sadržaj iz PDF dokumenta.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Aspose.Pdf.Plugins.TextExtractor objekt se koristi za ekstrakciju teksta, ili Aspose.Pdf.Plugins.ImageExtractor za ekstrakciju slika.
Constructors
PdfExtractor()
protected PdfExtractor()
Methods
Dispose()
Uvođenje IDisposable. zapravo, to nije potrebno za PdfExtractor.
public void Dispose()
Process(IPluginopcije)
Početak obrade PdfExtractor s određenim parametrima.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameters
pdfExtractorOptions
IPluginOptions
Objekt opcija koji sadrži upute za PDFExtractor.
Returns
Objekt ResultContainer koji sadrži rezultat ekstrakcije.