Class TextExtractor

Class TextExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Представляет плагин TextExtractor.

public class TextExtractor : PdfExtractor, IPlugin, IDisposable

Наследование

objectPdfExtractorTextExtractor

Реализует

IPlugin, IDisposable

Унаследованные члены

PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Примеры

Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.

// создайте объект TextExtractor для извлечения текста из содержимого PDF
using (TextExtractor extractor = new TextExtractor())
{
    // создайте TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();

    // добавьте путь к входному файлу в источники данных
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));

    // выполните процесс извлечения
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // получите извлеченный текст из объекта ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Замечания

Объект Aspose.Pdf.Plugins.TextExtractor используется для извлечения текста из PDF-документов.

Конструкторы

TextExtractor()

public TextExtractor()
 Русский