Class PdfExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Представляє базову функціональність для витягування тексту, зображень та інших типів вмісту, які можуть зустрічатися на сторінках PDF-документів.
public abstract class PdfExtractor : IPlugin, IDisposable
Спадкування
Похідні
Реалізує
Спадковані члени
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Приклади
Приклад демонструє, як витягнути текстовий вміст PDF-документа.
// створити об'єкт TextExtractor для витягування вмісту PDF
using (TextExtractor extractor = new TextExtractor())
{
// створити об'єкт TextExtractorOptions для налаштування інструкцій
textExtractorOptions = new TextExtractorOptions();
// додати шлях до вхідного файлу до джерел даних
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// виконати процес витягування
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// отримати витягнутий текст з об'єкта ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Зауваження
Об’єкт Aspose.Pdf.Plugins.TextExtractor використовується для витягування тексту, або Aspose.Pdf.Plugins.ImageExtractor для витягування зображень.
Конструктори
PdfExtractor()
protected PdfExtractor()
Методи
Dispose()
Реалізація IDisposable. Насправді, це не є необхідним для PdfExtractor.
public void Dispose()
Process(IPluginOptions)
Запускає обробку PdfExtractor з вказаними параметрами.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Параметри
pdfExtractorOptions
IPluginOptions
Об’єкт опцій, що містить інструкції для PdfExtractor.
Повертає
Об’єкт ResultContainer, що містить результат витягування.