Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Representa opções de extração de texto para o plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Herança
object ← PdfExtractorOptions ← TextExtractorOptions
Implementa
Membros Herdados
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Exemplos
O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.
// cria um objeto TextExtractor para extrair conteúdos do PDF
using (TextExtractor extractor = new TextExtractor())
{
// cria um objeto TextExtractorOptions para definir o TextFormattingMode (Puro ou Cru - padrão)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// adiciona o caminho do arquivo de entrada às fontes de dados
extractorOptions.AddInput(new FileDataSource(inputPath));
// realiza o processo de extração
ResultContainer resultContainer = extractor.Process(extractorOptions);
// obtém o texto extraído do objeto ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Observações
O objeto Aspose.Pdf.Plugins.TextExtractorOptions é utilizado para definir Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode e outras opções para a operação de extração de texto. Além disso, herda funções para adicionar dados (arquivos, streams) representando documentos PDF de entrada.
Construtores
TextExtractorOptions(TextFormattingMode)
Inicializa uma nova instância do objeto Aspose.Pdf.Plugins.TextExtractorOptions para o modo de formatação de texto especificado.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parâmetros
formattingMode
TextExtractorOptions.TextFormattingMode
Valor do modo de formatação de texto.
TextExtractorOptions()
Inicializa uma nova instância do objeto Aspose.Pdf.Plugins.TextExtractorOptions com o modo de formatação de texto ‘Cru’ (padrão).
public TextExtractorOptions()
Propriedades
FormattingMode
Obtém o modo de formatação.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Valor da Propriedade
TextExtractorOptions.TextFormattingMode
OperationName
Retorna o nome da operação.
public override string OperationName { get; }