Class TextExtractor

Class TextExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Representa el plugin TextExtractor.

public class TextExtractor : PdfExtractor, IPlugin, IDisposable

Herencia

objectPdfExtractorTextExtractor

Implementa

IPlugin, IDisposable

Miembros heredados

PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Ejemplos

El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.

// crear objeto TextExtractor para extraer texto en el contenido PDF
using (TextExtractor extractor = new TextExtractor())
{
    // crear TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();

    // agregar la ruta del archivo de entrada a las fuentes de datos
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));

    // realizar el proceso de extracción
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // obtener el texto extraído del objeto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Observaciones

El objeto Aspose.Pdf.Plugins.TextExtractor se utiliza para extraer texto en documentos PDF.

Constructores

TextExtractor()

public TextExtractor()
 Español