Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Представляє параметри витягування тексту для плагіна TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Спадкування
object ← PdfExtractorOptions ← TextExtractorOptions
Реалізує
Спадковані члени
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Приклади
Приклад демонструє, як витягти текстовий вміст PDF документа.
// створити об'єкт TextExtractor для витягування вмісту PDF
using (TextExtractor extractor = new TextExtractor())
{
// створити об'єкт TextExtractorOptions для налаштування TextFormattingMode (Pure або Raw - за замовчуванням)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// додати шлях до вхідного файлу до джерел даних
extractorOptions.AddInput(new FileDataSource(inputPath));
// виконати процес витягування
ResultContainer resultContainer = extractor.Process(extractorOptions);
// отримати витягнутий текст з об'єкта ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Зауваження
Об’єкт Aspose.Pdf.Plugins.TextExtractorOptions використовується для налаштування Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode та інших параметрів для операції витягування тексту. Також він успадковує функції для додавання даних (файлів, потоків), що представляють вхідні PDF документи.
Конструктори
TextExtractorOptions(TextFormattingMode)
Ініціалізує новий екземпляр об’єкта Aspose.Pdf.Plugins.TextExtractorOptions для вказаного режиму форматування тексту.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Параметри
formattingMode
TextExtractorOptions.TextFormattingMode
Значення режиму форматування тексту.
TextExtractorOptions()
Ініціалізує новий екземпляр об’єкта Aspose.Pdf.Plugins.TextExtractorOptions з ‘Raw’ (за замовчуванням) режимом форматування тексту.
public TextExtractorOptions()
Властивості
FormattingMode
Отримує режим форматування.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Значення властивості
TextExtractorOptions.TextFormattingMode
OperationName
Повертає назву операції.
public override string OperationName { get; }