Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Representa opções de extração de texto para o plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Herança

objectPdfExtractorOptionsTextExtractorOptions

Implementa

IPluginOptions

Membros Herdados

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Exemplos

O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.

// cria um objeto TextExtractor para extrair conteúdos do PDF
using (TextExtractor extractor = new TextExtractor())
{
    // cria um objeto TextExtractorOptions para definir o TextFormattingMode (Puro ou Cru - padrão)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // adiciona o caminho do arquivo de entrada às fontes de dados
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // realiza o processo de extração
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // obtém o texto extraído do objeto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Observações

O objeto Aspose.Pdf.Plugins.TextExtractorOptions é utilizado para definir Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode e outras opções para a operação de extração de texto. Além disso, herda funções para adicionar dados (arquivos, streams) representando documentos PDF de entrada.

Construtores

TextExtractorOptions(TextFormattingMode)

Inicializa uma nova instância do objeto Aspose.Pdf.Plugins.TextExtractorOptions para o modo de formatação de texto especificado.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parâmetros

formattingMode TextExtractorOptions.TextFormattingMode

Valor do modo de formatação de texto.

TextExtractorOptions()

Inicializa uma nova instância do objeto Aspose.Pdf.Plugins.TextExtractorOptions com o modo de formatação de texto ‘Cru’ (padrão).

public TextExtractorOptions()

Propriedades

FormattingMode

Obtém o modo de formatação.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Valor da Propriedade

TextExtractorOptions.TextFormattingMode

OperationName

Retorna o nome da operação.

public override string OperationName { get; }

Valor da Propriedade

string

 Português