Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

表示 TextExtractor 插件的文本提取选项。

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

继承

objectPdfExtractorOptionsTextExtractorOptions

实现

IPluginOptions

继承成员

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

示例

该示例演示了如何提取 PDF 文档的文本内容。

// 创建 TextExtractor 对象以提取 PDF 内容
using (TextExtractor extractor = new TextExtractor())
{
    // 创建 TextExtractorOptions 对象以设置文本格式模式(纯文本或原始文本 - 默认)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // 将输入文件路径添加到数据源
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // 执行提取过程
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // 从 ResultContainer 对象中获取提取的文本
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

备注

Aspose.Pdf.Plugins.TextExtractorOptions 对象用于设置 Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode 以及文本提取操作的其他选项。 此外,它还继承了添加表示输入 PDF 文档的数据(文件、流)的功能。

构造函数

TextExtractorOptions(TextFormattingMode)

初始化一个新的 Aspose.Pdf.Plugins.TextExtractorOptions 对象实例,指定文本格式模式。

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

参数

formattingMode TextExtractorOptions.TextFormattingMode

文本格式模式值。

TextExtractorOptions()

初始化一个新的 Aspose.Pdf.Plugins.TextExtractorOptions 对象实例,使用“原始”(默认)文本格式模式。

public TextExtractorOptions()

属性

FormattingMode

获取格式模式。

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

属性值

TextExtractorOptions.TextFormattingMode

OperationName

返回操作的名称。

public override string OperationName { get; }

属性值

string

 中文