Class PdfExtractor

Class PdfExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

يمثل الوظائف الأساسية لاستخراج النصوص والصور وأنواع المحتوى الأخرى التي قد تظهر في صفحات مستندات PDF.

public abstract class PdfExtractor : IPlugin, IDisposable

الوراثة

objectPdfExtractor

المشتقات

ImageExtractor, TextExtractor

التنفيذ

IPlugin, IDisposable

الأعضاء الموروثة

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

أمثلة

توضح المثال كيفية استخراج محتوى النص من مستند PDF.

// إنشاء كائن TextExtractor لاستخراج محتويات PDF
using (TextExtractor extractor = new TextExtractor())
{
    // إنشاء كائن TextExtractorOptions لتعيين التعليمات
    textExtractorOptions = new TextExtractorOptions();

    // إضافة مسار الملف المدخل إلى مصادر البيانات
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // تنفيذ عملية الاستخراج
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // الحصول على النص المستخرج من كائن ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

ملاحظات

يتم استخدام كائن Aspose.Pdf.Plugins.TextExtractor لاستخراج النصوص، أو Aspose.Pdf.Plugins.ImageExtractor لاستخراج الصور.

المنشئون

PdfExtractor()

protected PdfExtractor()

الطرق

Dispose()

تنفيذ لـ IDisposable. في الواقع، ليس من الضروري لـ PdfExtractor.

public void Dispose()

Process(IPluginOptions)

يبدأ معالجة PdfExtractor مع المعلمات المحددة.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

المعلمات

pdfExtractorOptions IPluginOptions

كائن خيارات يحتوي على تعليمات لـ PdfExtractor.

العائدات

ResultContainer

كائن ResultContainer يحتوي على نتيجة الاستخراج.

 عربي