Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Rappresenta le opzioni di estrazione del testo per il plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Ereditarietà
object ← PdfExtractorOptions ← TextExtractorOptions
Implementa
Membri Ereditati
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Esempi
L’esempio dimostra come estrarre il contenuto di testo di un documento PDF.
// crea un oggetto TextExtractor per estrarre i contenuti PDF
using (TextExtractor extractor = new TextExtractor())
{
// crea un oggetto TextExtractorOptions per impostare il TextFormattingMode (Pure, o Raw - predefinito)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// aggiungi il percorso del file di input alle fonti di dati
extractorOptions.AddInput(new FileDataSource(inputPath));
// esegui il processo di estrazione
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ottieni il testo estratto dall'oggetto ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Osservazioni
L’oggetto Aspose.Pdf.Plugins.TextExtractorOptions viene utilizzato per impostare Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, stream) che rappresentano documenti PDF di input.
Costruttori
TextExtractorOptions(TextFormattingMode)
Inizializza una nuova istanza dell’oggetto Aspose.Pdf.Plugins.TextExtractorOptions per la modalità di formattazione del testo specificata.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parametri
formattingMode
TextExtractorOptions.TextFormattingMode
Valore della modalità di formattazione del testo.
TextExtractorOptions()
Inizializza una nuova istanza dell’oggetto Aspose.Pdf.Plugins.TextExtractorOptions con la modalità di formattazione del testo ‘Raw’ (predefinita).
public TextExtractorOptions()
Proprietà
FormattingMode
Ottiene la modalità di formattazione.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Valore della Proprietà
TextExtractorOptions.TextFormattingMode
OperationName
Restituisce il nome dell’operazione.
public override string OperationName { get; }