Class PdfExtractor

名称: Aspose.Pdf.Plugins 合計: Aspose.PDF.dll (25.4.0)

テキスト、画像、および PDF ドキュメントのページに発生する可能性のある他の種類のコンテンツを抽出するためのベース機能を表します。

public abstract class PdfExtractor : IPlugin, IDisposable

Examples

例では、PDF文書からテキストコンテンツを抽出する方法を示しています。

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();

    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Remarks

Aspose.Pdf.Plugins.TextExtractor オブジェクトは、テキスト、または Aspose.Pdf.Plugins.ImageExtractor を抽出するために使用されます。

Constructors

PdfExtractor()

protected PdfExtractor()

Methods

Dispose()

IDISPOSABLEの実施実際には、PdfExtractorには必要ありません。

public void Dispose()

Process(IPluginオプション)

PdfExtractor 処理は指定されたパラメーターで開始します。

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parameters

pdfExtractorOptions IPluginOptions

PdfExtractor の指示を含むオプションオブジェクト。

Returns

ResultContainer

抽出の結果を含む ResultContainer オブジェクト。