Class PdfExtractor

Class PdfExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Представляє базову функціональність для витягування тексту, зображень та інших типів вмісту, які можуть зустрічатися на сторінках PDF-документів.

public abstract class PdfExtractor : IPlugin, IDisposable

Спадкування

objectPdfExtractor

Похідні

ImageExtractor, TextExtractor

Реалізує

IPlugin, IDisposable

Спадковані члени

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Приклади

Приклад демонструє, як витягнути текстовий вміст PDF-документа.

// створити об'єкт TextExtractor для витягування вмісту PDF
using (TextExtractor extractor = new TextExtractor())
{
    // створити об'єкт TextExtractorOptions для налаштування інструкцій
    textExtractorOptions = new TextExtractorOptions();

    // додати шлях до вхідного файлу до джерел даних
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // виконати процес витягування
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // отримати витягнутий текст з об'єкта ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Зауваження

Об’єкт Aspose.Pdf.Plugins.TextExtractor використовується для витягування тексту, або Aspose.Pdf.Plugins.ImageExtractor для витягування зображень.

Конструктори

PdfExtractor()

protected PdfExtractor()

Методи

Dispose()

Реалізація IDisposable. Насправді, це не є необхідним для PdfExtractor.

public void Dispose()

Process(IPluginOptions)

Запускає обробку PdfExtractor з вказаними параметрами.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Параметри

pdfExtractorOptions IPluginOptions

Об’єкт опцій, що містить інструкції для PdfExtractor.

Повертає

ResultContainer

Об’єкт ResultContainer, що містить результат витягування.

 Українська