Class TextExtractor
Class TextExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Представляет плагин TextExtractor.
public class TextExtractor : PdfExtractor, IPlugin, IDisposable
Наследование
object ← PdfExtractor ← TextExtractor
Реализует
Унаследованные члены
PdfExtractor.Process(IPluginOptions), PdfExtractor.Dispose(), object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Примеры
Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.
// создайте объект TextExtractor для извлечения текста из содержимого PDF
using (TextExtractor extractor = new TextExtractor())
{
// создайте TextExtractorOptions
textExtractorOptions = new TextExtractorOptions();
// добавьте путь к входному файлу в источники данных
textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
// выполните процесс извлечения
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// получите извлеченный текст из объекта ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Замечания
Объект Aspose.Pdf.Plugins.TextExtractor используется для извлечения текста из PDF-документов.
Конструкторы
TextExtractor()
public TextExtractor()