Class TextExtractor

Class TextExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

表示 TextExtractor 插件。

public class TextExtractor : PdfExtractor, IPlugin, IDisposable

继承

objectPdfExtractorTextExtractor

实现

IPlugin, IDisposable

继承成员

PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

示例

该示例演示如何提取 PDF 文档的文本内容。

// 创建 TextExtractor 对象以提取 PDF 内容中的文本
using (TextExtractor extractor = new TextExtractor())
{
    // 创建 TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();

    // 将输入文件路径添加到数据源
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));

    // 执行提取过程
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // 从 ResultContainer 对象中获取提取的文本
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

备注

Aspose.Pdf.Plugins.TextExtractor 对象用于提取 PDF 文档中的文本。

构造函数

TextExtractor()

public TextExtractor()
 中文