Class PdfExtractor
Class PdfExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
แสดงฟังก์ชันพื้นฐานในการดึงข้อความ รูปภาพ และประเภทเนื้อหาอื่น ๆ ที่อาจเกิดขึ้นในหน้าเอกสาร PDF
public abstract class PdfExtractor : IPlugin, IDisposable
การสืบทอด
ที่สืบทอด
การใช้งาน
สมาชิกที่สืบทอด
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
ตัวอย่าง
ตัวอย่างนี้แสดงวิธีการดึงเนื้อหาข้อความของเอกสาร PDF
// สร้างวัตถุ TextExtractor เพื่อดึงเนื้อหา PDF
using (TextExtractor extractor = new TextExtractor())
{
// สร้างวัตถุ TextExtractorOptions เพื่อกำหนดคำแนะนำ
textExtractorOptions = new TextExtractorOptions();
// เพิ่มเส้นทางไฟล์นำเข้าลงในแหล่งข้อมูล
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// ดำเนินการกระบวนการดึงข้อมูล
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// รับข้อความที่ดึงออกมาจากวัตถุ ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
หมายเหตุ
วัตถุ Aspose.Pdf.Plugins.TextExtractor ถูกใช้เพื่อดึงข้อความ หรือ Aspose.Pdf.Plugins.ImageExtractor เพื่อดึงรูปภาพ
ตัวสร้าง
PdfExtractor()
protected PdfExtractor()
วิธีการ
Dispose()
การใช้งาน IDisposable จริง ๆ แล้วไม่จำเป็นสำหรับ PdfExtractor
public void Dispose()
Process(IPluginOptions)
เริ่มการประมวลผล PdfExtractor ด้วยพารามิเตอร์ที่กำหนด
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
พารามิเตอร์
pdfExtractorOptions
IPluginOptions
วัตถุทางเลือกที่มีคำแนะนำสำหรับ PdfExtractor
คืนค่า
วัตถุ ResultContainer ที่มีผลลัพธ์ของการดึงข้อมูล