Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
گزینههای استخراج متن را برای پلاگین TextExtractor نمایش میدهد.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
وراثت
object ← PdfExtractorOptions ← TextExtractorOptions
پیادهسازیها
اعضای به ارث رسیده
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
مثالها
این مثال نشان میدهد که چگونه محتوای متنی یک سند PDF استخراج شود.
// ایجاد شی TextExtractor برای استخراج محتوای PDF
using (TextExtractor extractor = new TextExtractor())
{
// ایجاد شی TextExtractorOptions برای تنظیم TextFormattingMode (خالص یا خام - پیشفرض)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// اضافه کردن مسیر فایل ورودی به منابع داده
extractorOptions.AddInput(new FileDataSource(inputPath));
// انجام فرآیند استخراج
ResultContainer resultContainer = extractor.Process(extractorOptions);
// دریافت متن استخراج شده از شی ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
ملاحظات
شی Aspose.Pdf.Plugins.TextExtractorOptions برای تنظیم Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode و سایر گزینهها برای عملیات استخراج متن استفاده میشود. همچنین، توابعی برای اضافه کردن دادهها (فایلها، جریانات) که نمایانگر اسناد PDF ورودی هستند، به ارث میبرد.
سازندهها
TextExtractorOptions(TextFormattingMode)
یک نمونه جدید از شی Aspose.Pdf.Plugins.TextExtractorOptions را برای حالت فرمتبندی متن مشخص شده اولیهسازی میکند.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
پارامترها
formattingMode
TextExtractorOptions.TextFormattingMode
مقدار حالت فرمتبندی متن.
TextExtractorOptions()
یک نمونه جدید از شی Aspose.Pdf.Plugins.TextExtractorOptions را با حالت فرمتبندی متن ‘خام’ (پیشفرض) اولیهسازی میکند.
public TextExtractorOptions()
ویژگیها
FormattingMode
حالت فرمتبندی را دریافت میکند.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
مقدار ویژگی
TextExtractorOptions.TextFormattingMode
OperationName
نام عملیات را برمیگرداند.
public override string OperationName { get; }