Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Representa las opciones de extracción de texto para el complemento TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Herencia
object ← PdfExtractorOptions ← TextExtractorOptions
Implementa
Miembros heredados
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Ejemplos
El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.
// crear objeto TextExtractor para extraer contenidos PDF
using (TextExtractor extractor = new TextExtractor())
{
// crear objeto TextExtractorOptions para establecer TextFormattingMode (Puro, o Crudo - por defecto)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// agregar la ruta del archivo de entrada a las fuentes de datos
extractorOptions.AddInput(new FileDataSource(inputPath));
// realizar el proceso de extracción
ResultContainer resultContainer = extractor.Process(extractorOptions);
// obtener el texto extraído del objeto ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Observaciones
El objeto Aspose.Pdf.Plugins.TextExtractorOptions se utiliza para establecer Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode y otras opciones para la operación de extracción de texto. Además, hereda funciones para agregar datos (archivos, flujos) que representan documentos PDF de entrada.
Constructores
TextExtractorOptions(TextFormattingMode)
Inicializa una nueva instancia del objeto Aspose.Pdf.Plugins.TextExtractorOptions para el modo de formato de texto especificado.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parámetros
formattingMode
TextExtractorOptions.TextFormattingMode
Valor del modo de formato de texto.
TextExtractorOptions()
Inicializa una nueva instancia del objeto Aspose.Pdf.Plugins.TextExtractorOptions con el modo de formato de texto ‘Crudo’ (por defecto).
public TextExtractorOptions()
Propiedades
FormattingMode
Obtiene el modo de formato.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Valor de la propiedad
TextExtractorOptions.TextFormattingMode
OperationName
Devuelve el nombre de la operación.
public override string OperationName { get; }