Class TextExtractorOptions

Class TextExtractorOptions

Pôvodný názov: Aspose.Pdf.Plugins Zhromaždenie: Aspose.PDF.dll (25.4.0)

Predstavuje možnosti extrakcie textu pre plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Inheritance

object PdfExtractorOptions TextExtractorOptions

Implements

IPluginOptions

Z dedičných členov

PdfExtractorOptions.AddInput(IDataSource) , PdfExtractorOptions.Inputs , PdfExtractorOptions.OperationName , object.GetType() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Examples

Príklad ukazuje, ako extrahovať textový obsah z PDF dokumentu.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Aspose.Pdf.Plugins.TextExtractorOptions objekt sa používa na nastavenie Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode a ďalšie možnosti pre text extrakcie prevádzky.Taktiež zdedí funkcie pridávania údajov (file, toky), ktoré predstavujú vstupné PDF dokumenty.

Constructors

TextExtractorOptions(TextFormattingMode)

Initalizuje nový príklad objektu Aspose.Pdf.Plugins.TextExtractorOptions pre špecifikovaný režim formátovania textu.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parameters

formattingMode TextExtractorOptions . TextFormattingMode

Text formátovanie režimu hodnoty.

TextExtractorOptions()

Initalizuje nový príklad objektu Aspose.Pdf.Plugins.TextExtractorOptions s režimom formátovania textu ‘Raw’ (default).

public TextExtractorOptions()

Properties

FormattingMode

Dostáva formátovanie módy.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Hodnota nehnuteľnosti

TextExtractorOptions . TextFormattingMode

OperationName

Vráti názov operácie.

public override string OperationName { get; }

Hodnota nehnuteľnosti

string

 Slovenčina