Class PdfExtractor

Class PdfExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

แสดงฟังก์ชันพื้นฐานในการดึงข้อความ รูปภาพ และประเภทเนื้อหาอื่น ๆ ที่อาจเกิดขึ้นในหน้าเอกสาร PDF

public abstract class PdfExtractor : IPlugin, IDisposable

การสืบทอด

objectPdfExtractor

ที่สืบทอด

ImageExtractor, TextExtractor

การใช้งาน

IPlugin, IDisposable

สมาชิกที่สืบทอด

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

ตัวอย่าง

ตัวอย่างนี้แสดงวิธีการดึงเนื้อหาข้อความของเอกสาร PDF

// สร้างวัตถุ TextExtractor เพื่อดึงเนื้อหา PDF
using (TextExtractor extractor = new TextExtractor())
{
    // สร้างวัตถุ TextExtractorOptions เพื่อกำหนดคำแนะนำ
    textExtractorOptions = new TextExtractorOptions();

    // เพิ่มเส้นทางไฟล์นำเข้าลงในแหล่งข้อมูล
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // ดำเนินการกระบวนการดึงข้อมูล
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // รับข้อความที่ดึงออกมาจากวัตถุ ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

หมายเหตุ

วัตถุ Aspose.Pdf.Plugins.TextExtractor ถูกใช้เพื่อดึงข้อความ หรือ Aspose.Pdf.Plugins.ImageExtractor เพื่อดึงรูปภาพ

ตัวสร้าง

PdfExtractor()

protected PdfExtractor()

วิธีการ

Dispose()

การใช้งาน IDisposable จริง ๆ แล้วไม่จำเป็นสำหรับ PdfExtractor

public void Dispose()

Process(IPluginOptions)

เริ่มการประมวลผล PdfExtractor ด้วยพารามิเตอร์ที่กำหนด

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

พารามิเตอร์

pdfExtractorOptions IPluginOptions

วัตถุทางเลือกที่มีคำแนะนำสำหรับ PdfExtractor

คืนค่า

ResultContainer

วัตถุ ResultContainer ที่มีผลลัพธ์ของการดึงข้อมูล

 แบบไทย