Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

TextExtractorプラグインのテキスト抽出オプションを表します。

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

継承

objectPdfExtractorOptionsTextExtractorOptions

実装

IPluginOptions

継承メンバー

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

この例では、PDFドキュメントのテキストコンテンツを抽出する方法を示します。

// PDFコンテンツを抽出するためのTextExtractorオブジェクトを作成
using (TextExtractor extractor = new TextExtractor())
{
    // TextFormattingMode(PureまたはRaw - デフォルト)を設定するためのTextExtractorOptionsオブジェクトを作成
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // データソースに入力ファイルパスを追加
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // 抽出プロセスを実行
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ResultContainerオブジェクトから抽出されたテキストを取得
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

備考

Aspose.Pdf.Plugins.TextExtractorOptionsオブジェクトは、Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingModeやテキスト抽出操作の他のオプションを設定するために使用されます。また、入力PDFドキュメントを表すデータ(ファイル、ストリーム)を追加するための機能を継承します。

コンストラクタ

TextExtractorOptions(TextFormattingMode)

指定されたテキストフォーマットモードのために、Aspose.Pdf.Plugins.TextExtractorOptionsオブジェクトの新しいインスタンスを初期化します。

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

パラメータ

formattingMode TextExtractorOptions.TextFormattingMode

テキストフォーマットモードの値。

TextExtractorOptions()

‘Raw’(デフォルト)テキストフォーマットモードでAspose.Pdf.Plugins.TextExtractorOptionsオブジェクトの新しいインスタンスを初期化します。

public TextExtractorOptions()

プロパティ

FormattingMode

フォーマットモードを取得します。

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

プロパティ値

TextExtractorOptions.TextFormattingMode

OperationName

操作の名前を返します。

public override string OperationName { get; }

プロパティ値

string

 日本語