Class TextExtractorOptions

Class TextExtractorOptions

Navne til: Aspose.Pdf.Plugins Sammensætning: Aspose.PDF.dll (25.4.0)

Det repræsenterer tekst ekstraktionsmuligheder for TextExtractor plugin.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Inheritance

object PdfExtractorOptions TextExtractorOptions

Implements

IPluginOptions

De arvede medlemmer

PdfExtractorOptions.AddInput(IDataSource) , PdfExtractorOptions.Inputs , PdfExtractorOptions.OperationName , object.GetType() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Examples

Eksemplet viser, hvordan man ekstraherer tekstindhold fra PDF-dokumentet.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Aspose.Pdf.Plugins.TextExtractorOptions-objektet bruges til at indstille Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode og andre muligheder for tekstudvinding.Også, det arvede funktioner til at tilføje data (filer, strømme) repræsenterer input PDF-dokumenter.

Constructors

TextExtractorOptions(TextFormattingMode)

Initialiserer et nyt eksempel på Aspose.Pdf.Plugins.TextExtractorOptions-objektet for den angivne tekstformateringstilstand.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parameters

formattingMode TextExtractorOptions . TextFormattingMode

Tekstformatering af modeværdi.

TextExtractorOptions()

Initialiserer et nyt eksempel på Aspose.Pdf.Plugins.TextExtractorOptions-objektet med ‘Raw’ (default) tekstformateringstilstand.

public TextExtractorOptions()

Properties

FormattingMode

Formater modet.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Ejendomsværdi

TextExtractorOptions . TextFormattingMode

OperationName

Tilbage navnet på operationen.

public override string OperationName { get; }

Ejendomsværdi

string

 Dansk