Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Представляє параметри витягування тексту для плагіна TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Спадкування

objectPdfExtractorOptionsTextExtractorOptions

Реалізує

IPluginOptions

Спадковані члени

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Приклади

Приклад демонструє, як витягти текстовий вміст PDF документа.

// створити об'єкт TextExtractor для витягування вмісту PDF
using (TextExtractor extractor = new TextExtractor())
{
    // створити об'єкт TextExtractorOptions для налаштування TextFormattingMode (Pure або Raw - за замовчуванням)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // додати шлях до вхідного файлу до джерел даних
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // виконати процес витягування
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // отримати витягнутий текст з об'єкта ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Зауваження

Об’єкт Aspose.Pdf.Plugins.TextExtractorOptions використовується для налаштування Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode та інших параметрів для операції витягування тексту. Також він успадковує функції для додавання даних (файлів, потоків), що представляють вхідні PDF документи.

Конструктори

TextExtractorOptions(TextFormattingMode)

Ініціалізує новий екземпляр об’єкта Aspose.Pdf.Plugins.TextExtractorOptions для вказаного режиму форматування тексту.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Параметри

formattingMode TextExtractorOptions.TextFormattingMode

Значення режиму форматування тексту.

TextExtractorOptions()

Ініціалізує новий екземпляр об’єкта Aspose.Pdf.Plugins.TextExtractorOptions з ‘Raw’ (за замовчуванням) режимом форматування тексту.

public TextExtractorOptions()

Властивості

FormattingMode

Отримує режим форматування.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Значення властивості

TextExtractorOptions.TextFormattingMode

OperationName

Повертає назву операції.

public override string OperationName { get; }

Значення властивості

string

 Українська