Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
表示 TextExtractor 插件的文本提取选项。
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
继承
object ← PdfExtractorOptions ← TextExtractorOptions
实现
继承成员
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
示例
该示例演示了如何提取 PDF 文档的文本内容。
// 创建 TextExtractor 对象以提取 PDF 内容
using (TextExtractor extractor = new TextExtractor())
{
// 创建 TextExtractorOptions 对象以设置文本格式模式(纯文本或原始文本 - 默认)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// 将输入文件路径添加到数据源
extractorOptions.AddInput(new FileDataSource(inputPath));
// 执行提取过程
ResultContainer resultContainer = extractor.Process(extractorOptions);
// 从 ResultContainer 对象中获取提取的文本
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
备注
Aspose.Pdf.Plugins.TextExtractorOptions 对象用于设置 Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode 以及文本提取操作的其他选项。 此外,它还继承了添加表示输入 PDF 文档的数据(文件、流)的功能。
构造函数
TextExtractorOptions(TextFormattingMode)
初始化一个新的 Aspose.Pdf.Plugins.TextExtractorOptions 对象实例,指定文本格式模式。
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
参数
formattingMode
TextExtractorOptions.TextFormattingMode
文本格式模式值。
TextExtractorOptions()
初始化一个新的 Aspose.Pdf.Plugins.TextExtractorOptions 对象实例,使用“原始”(默认)文本格式模式。
public TextExtractorOptions()
属性
FormattingMode
获取格式模式。
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
属性值
TextExtractorOptions.TextFormattingMode
OperationName
返回操作的名称。
public override string OperationName { get; }