Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Representerar alternativ för textutvinning för TextExtractor-plugin.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Arv
object ← PdfExtractorOptions ← TextExtractorOptions
Implementerar
Ärvda Medlemmar
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Exempel
Exemplet visar hur man extraherar textinnehåll från en PDF-dokument.
// skapa TextExtractor-objekt för att extrahera PDF-innehåll
using (TextExtractor extractor = new TextExtractor())
{
// skapa TextExtractorOptions-objekt för att ställa in TextFormattingMode (Pure eller Raw - standard)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// lägg till filväg till datakällor
extractorOptions.AddInput(new FileDataSource(inputPath));
// utför extraktionsprocessen
ResultContainer resultContainer = extractor.Process(extractorOptions);
// få den extraherade texten från ResultContainer-objektet
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Anmärkningar
Aspose.Pdf.Plugins.TextExtractorOptions-objektet används för att ställa in Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode och andra alternativ för textutvinningsoperationen. Det är ocksåverkar funktioner för att lägga till data (filer, strömmar) som representerar inmatade PDF-dokument.
Konstruktörer
TextExtractorOptions(TextFormattingMode)
Initierar en ny instans av Aspose.Pdf.Plugins.TextExtractorOptions-objektet för den angivna textformateringsläget.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parametrar
formattingMode
TextExtractorOptions.TextFormattingMode
Värde för textformateringsläge.
TextExtractorOptions()
Initierar en ny instans av Aspose.Pdf.Plugins.TextExtractorOptions-objektet med ‘Raw’ (standard) textformateringsläge.
public TextExtractorOptions()
Egenskaper
FormattingMode
Hämtar formateringsläge.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Egenskapsvärde
TextExtractorOptions.TextFormattingMode
OperationName
Returnerar namnet på operationen.
public override string OperationName { get; }