Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Представляет параметры извлечения текста для плагина TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Наследование
object ← PdfExtractorOptions ← TextExtractorOptions
Реализует
Унаследованные члены
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Примеры
Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.
// создаем объект TextExtractor для извлечения содержимого PDF
using (TextExtractor extractor = new TextExtractor())
{
// создаем объект TextExtractorOptions для установки TextFormattingMode (Pure или Raw - по умолчанию)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// добавляем путь к входному файлу в источники данных
extractorOptions.AddInput(new FileDataSource(inputPath));
// выполняем процесс извлечения
ResultContainer resultContainer = extractor.Process(extractorOptions);
// получаем извлеченный текст из объекта ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Замечания
Объект Aspose.Pdf.Plugins.TextExtractorOptions используется для установки Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode и других параметров для операции извлечения текста. Кроме того, он наследует функции для добавления данных (файлы, потоки), представляющих входные PDF-документы.
Конструкторы
TextExtractorOptions(TextFormattingMode)
Инициализирует новый экземпляр объекта Aspose.Pdf.Plugins.TextExtractorOptions для указанного режима форматирования текста.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Параметры
formattingMode
TextExtractorOptions.TextFormattingMode
Значение режима форматирования текста.
TextExtractorOptions()
Инициализирует новый экземпляр объекта Aspose.Pdf.Plugins.TextExtractorOptions с режимом форматирования текста ‘Raw’ (по умолчанию).
public TextExtractorOptions()
Свойства
FormattingMode
Получает режим форматирования.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Значение свойства
TextExtractorOptions.TextFormattingMode
OperationName
Возвращает имя операции.
public override string OperationName { get; }