Class TextExtractorOptions
Navne til: Aspose.Pdf.Plugins Sammensætning: Aspose.PDF.dll (25.4.0)
Det repræsenterer tekst ekstraktionsmuligheder for TextExtractor plugin.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Inheritance
object ← PdfExtractorOptions ← TextExtractorOptions
Implements
De arvede medlemmer
PdfExtractorOptions.AddInput(IDataSource) , PdfExtractorOptions.Inputs , PdfExtractorOptions.OperationName , object.GetType() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
Eksemplet viser, hvordan man ekstraherer tekstindhold fra PDF-dokumentet.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Aspose.Pdf.Plugins.TextExtractorOptions-objektet bruges til at indstille Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode og andre muligheder for tekstudvinding.Også, det arvede funktioner til at tilføje data (filer, strømme) repræsenterer input PDF-dokumenter.
Constructors
TextExtractorOptions(TextFormattingMode)
Initialiserer et nyt eksempel på Aspose.Pdf.Plugins.TextExtractorOptions-objektet for den angivne tekstformateringstilstand.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parameters
formattingMode
TextExtractorOptions
.
TextFormattingMode
Tekstformatering af modeværdi.
TextExtractorOptions()
Initialiserer et nyt eksempel på Aspose.Pdf.Plugins.TextExtractorOptions-objektet med ‘Raw’ (default) tekstformateringstilstand.
public TextExtractorOptions()
Properties
FormattingMode
Formater modet.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Ejendomsværdi
TextExtractorOptions . TextFormattingMode
OperationName
Tilbage navnet på operationen.
public override string OperationName { get; }