Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

گزینه‌های استخراج متن را برای پلاگین TextExtractor نمایش می‌دهد.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

وراثت

objectPdfExtractorOptionsTextExtractorOptions

پیاده‌سازی‌ها

IPluginOptions

اعضای به ارث رسیده

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

مثال‌ها

این مثال نشان می‌دهد که چگونه محتوای متنی یک سند PDF استخراج شود.

// ایجاد شی TextExtractor برای استخراج محتوای PDF
using (TextExtractor extractor = new TextExtractor())
{
    // ایجاد شی TextExtractorOptions برای تنظیم TextFormattingMode (خالص یا خام - پیش‌فرض)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // اضافه کردن مسیر فایل ورودی به منابع داده
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // انجام فرآیند استخراج
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // دریافت متن استخراج شده از شی ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

ملاحظات

شی Aspose.Pdf.Plugins.TextExtractorOptions برای تنظیم Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode و سایر گزینه‌ها برای عملیات استخراج متن استفاده می‌شود. همچنین، توابعی برای اضافه کردن داده‌ها (فایل‌ها، جریانات) که نمایانگر اسناد PDF ورودی هستند، به ارث می‌برد.

سازنده‌ها

TextExtractorOptions(TextFormattingMode)

یک نمونه جدید از شی Aspose.Pdf.Plugins.TextExtractorOptions را برای حالت فرمت‌بندی متن مشخص شده اولیه‌سازی می‌کند.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

پارامترها

formattingMode TextExtractorOptions.TextFormattingMode

مقدار حالت فرمت‌بندی متن.

TextExtractorOptions()

یک نمونه جدید از شی Aspose.Pdf.Plugins.TextExtractorOptions را با حالت فرمت‌بندی متن ‘خام’ (پیش‌فرض) اولیه‌سازی می‌کند.

public TextExtractorOptions()

ویژگی‌ها

FormattingMode

حالت فرمت‌بندی را دریافت می‌کند.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

مقدار ویژگی

TextExtractorOptions.TextFormattingMode

OperationName

نام عملیات را برمی‌گرداند.

public override string OperationName { get; }

مقدار ویژگی

string

 فارسی