Class TextExtractor
Class TextExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Representa o plugin TextExtractor.
public class TextExtractor : PdfExtractor, IPlugin, IDisposable
Herança
object ← PdfExtractor ← TextExtractor
Implementa
Membros Herdados
PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Exemplos
O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.
// cria um objeto TextExtractor para extrair texto no conteúdo do PDF
using (TextExtractor extractor = new TextExtractor())
{
// cria TextExtractorOptions
textExtractorOptions = new TextExtractorOptions();
// adiciona o caminho do arquivo de entrada às fontes de dados
textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
// realiza o processo de extração
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// obtém o texto extraído do objeto ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Observações
O objeto Aspose.Pdf.Plugins.TextExtractor é utilizado para extrair texto em documentos PDF.
Construtores
TextExtractor()
public TextExtractor()