Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
TextExtractorプラグインのテキスト抽出オプションを表します。
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
継承
object ← PdfExtractorOptions ← TextExtractorOptions
実装
継承メンバー
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
例
この例では、PDFドキュメントのテキストコンテンツを抽出する方法を示します。
// PDFコンテンツを抽出するためのTextExtractorオブジェクトを作成
using (TextExtractor extractor = new TextExtractor())
{
// TextFormattingMode(PureまたはRaw - デフォルト)を設定するためのTextExtractorOptionsオブジェクトを作成
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// データソースに入力ファイルパスを追加
extractorOptions.AddInput(new FileDataSource(inputPath));
// 抽出プロセスを実行
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ResultContainerオブジェクトから抽出されたテキストを取得
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
備考
Aspose.Pdf.Plugins.TextExtractorOptionsオブジェクトは、Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingModeやテキスト抽出操作の他のオプションを設定するために使用されます。また、入力PDFドキュメントを表すデータ(ファイル、ストリーム)を追加するための機能を継承します。
コンストラクタ
TextExtractorOptions(TextFormattingMode)
指定されたテキストフォーマットモードのために、Aspose.Pdf.Plugins.TextExtractorOptionsオブジェクトの新しいインスタンスを初期化します。
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
パラメータ
formattingMode
TextExtractorOptions.TextFormattingMode
テキストフォーマットモードの値。
TextExtractorOptions()
‘Raw’(デフォルト)テキストフォーマットモードでAspose.Pdf.Plugins.TextExtractorOptionsオブジェクトの新しいインスタンスを初期化します。
public TextExtractorOptions()
プロパティ
FormattingMode
フォーマットモードを取得します。
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
プロパティ値
TextExtractorOptions.TextFormattingMode
OperationName
操作の名前を返します。
public override string OperationName { get; }