Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Представляет параметры извлечения текста для плагина TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Наследование

objectPdfExtractorOptionsTextExtractorOptions

Реализует

IPluginOptions

Унаследованные члены

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Примеры

Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.

// создаем объект TextExtractor для извлечения содержимого PDF
using (TextExtractor extractor = new TextExtractor())
{
    // создаем объект TextExtractorOptions для установки TextFormattingMode (Pure или Raw - по умолчанию)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // добавляем путь к входному файлу в источники данных
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // выполняем процесс извлечения
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // получаем извлеченный текст из объекта ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Замечания

Объект Aspose.Pdf.Plugins.TextExtractorOptions используется для установки Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode и других параметров для операции извлечения текста. Кроме того, он наследует функции для добавления данных (файлы, потоки), представляющих входные PDF-документы.

Конструкторы

TextExtractorOptions(TextFormattingMode)

Инициализирует новый экземпляр объекта Aspose.Pdf.Plugins.TextExtractorOptions для указанного режима форматирования текста.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Параметры

formattingMode TextExtractorOptions.TextFormattingMode

Значение режима форматирования текста.

TextExtractorOptions()

Инициализирует новый экземпляр объекта Aspose.Pdf.Plugins.TextExtractorOptions с режимом форматирования текста ‘Raw’ (по умолчанию).

public TextExtractorOptions()

Свойства

FormattingMode

Получает режим форматирования.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Значение свойства

TextExtractorOptions.TextFormattingMode

OperationName

Возвращает имя операции.

public override string OperationName { get; }

Значение свойства

string

 Русский