Class PdfExtractor
A név: Aspose.Pdf.Plugins Összefoglaló: Aspose.PDF.dll (25.4.0)
Az alapfunkció a szöveg, a képek és más típusú tartalmak kivonására szolgál, amelyek a PDF dokumentumok oldalán előfordulhatnak.
public abstract class PdfExtractor : IPlugin, IDisposable
Inheritance
Derived
ImageExtractor , TextExtractor
Implements
Örökletes tagok
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
A példa azt mutatja, hogyan lehet kivonni a szöveges tartalmat a PDF dokumentumból.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Az Aspose.Pdf.Plugins.TextExtractor objektumot használják a szöveg kivonására, vagy az Aspose.Pdf.Plugins.ImageExtractor a képek kivonására.
Constructors
PdfExtractor()
protected PdfExtractor()
Methods
Dispose()
Végrehajtása IDisposable. valójában nem szükséges a PdfExtractor.
public void Dispose()
Process(IPluginOpciók)
Kezdődik a PdfExtractor feldolgozása a meghatározott paraméterekkel.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameters
pdfExtractorOptions
IPluginOptions
Egy opció objektum, amely a PDFExtractor utasításait tartalmazza.
Returns
Egy ResultContainer objektum, amely tartalmazza a kivonat eredményét.