Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Representa las opciones de extracción de texto para el complemento TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Herencia

objectPdfExtractorOptionsTextExtractorOptions

Implementa

IPluginOptions

Miembros heredados

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Ejemplos

El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.

// crear objeto TextExtractor para extraer contenidos PDF
using (TextExtractor extractor = new TextExtractor())
{
    // crear objeto TextExtractorOptions para establecer TextFormattingMode (Puro, o Crudo - por defecto)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // agregar la ruta del archivo de entrada a las fuentes de datos
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // realizar el proceso de extracción
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // obtener el texto extraído del objeto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Observaciones

El objeto Aspose.Pdf.Plugins.TextExtractorOptions se utiliza para establecer Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode y otras opciones para la operación de extracción de texto. Además, hereda funciones para agregar datos (archivos, flujos) que representan documentos PDF de entrada.

Constructores

TextExtractorOptions(TextFormattingMode)

Inicializa una nueva instancia del objeto Aspose.Pdf.Plugins.TextExtractorOptions para el modo de formato de texto especificado.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parámetros

formattingMode TextExtractorOptions.TextFormattingMode

Valor del modo de formato de texto.

TextExtractorOptions()

Inicializa una nueva instancia del objeto Aspose.Pdf.Plugins.TextExtractorOptions con el modo de formato de texto ‘Crudo’ (por defecto).

public TextExtractorOptions()

Propiedades

FormattingMode

Obtiene el modo de formato.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Valor de la propiedad

TextExtractorOptions.TextFormattingMode

OperationName

Devuelve el nombre de la operación.

public override string OperationName { get; }

Valor de la propiedad

string

 Español