Class TextExtractor

Class TextExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Representa o plugin TextExtractor.

public class TextExtractor : PdfExtractor, IPlugin, IDisposable

Herança

objectPdfExtractorTextExtractor

Implementa

IPlugin, IDisposable

Membros Herdados

PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Exemplos

O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.

// cria um objeto TextExtractor para extrair texto no conteúdo do PDF
using (TextExtractor extractor = new TextExtractor())
{
    // cria TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();

    // adiciona o caminho do arquivo de entrada às fontes de dados
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));

    // realiza o processo de extração
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // obtém o texto extraído do objeto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Observações

O objeto Aspose.Pdf.Plugins.TextExtractor é utilizado para extrair texto em documentos PDF.

Construtores

TextExtractor()

public TextExtractor()
 Português