Class PdfExtractor

Class PdfExtractor

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

PDF belgelerinin sayfalarında yer alabilecek metin, resim ve diğer içerik türlerini çıkarmak için temel işlevselliği temsil eder.

public abstract class PdfExtractor : IPlugin, IDisposable

Miras

objectPdfExtractor

Türetilmiş

ImageExtractor, TextExtractor

Uygulamalar

IPlugin, IDisposable

Miras Alınan Üyeler

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Örnekler

Bu örnek, bir PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.

// PDF içeriklerini çıkarmak için TextExtractor nesnesi oluştur
using (TextExtractor extractor = new TextExtractor())
{
    // talimatları ayarlamak için TextExtractorOptions nesnesi oluştur
    textExtractorOptions = new TextExtractorOptions();

    // veri kaynaklarına girdi dosyası yolunu ekle
    textExtractorOptions.AddInput(new FileDataSource(inputPath));

    // çıkarım işlemini gerçekleştir
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);

    // ResultContainer nesnesinden çıkarılan metni al
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Açıklamalar

Aspose.Pdf.Plugins.TextExtractor nesnesi metin çıkarmak için, Aspose.Pdf.Plugins.ImageExtractor ise resim çıkarmak için kullanılır.

Yapıcılar

PdfExtractor()

protected PdfExtractor()

Metodlar

Dispose()

IDisposable’ın uygulanması. Aslında, PdfExtractor için gerekli değildir.

public void Dispose()

Process(IPluginOptions)

Belirtilen parametrelerle PdfExtractor işlemini başlatır.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Parametreler

pdfExtractorOptions IPluginOptions

PdfExtractor için talimatlar içeren bir seçenek nesnesi.

Dönüş Değeri

ResultContainer

Çıkarım sonucunu içeren bir ResultContainer nesnesi.

 Türkçe