Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
텍스트 추출 옵션을 나타내는 TextExtractor 플러그인입니다.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
상속
object ← PdfExtractorOptions ← TextExtractorOptions
구현
상속된 멤버
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
예제
이 예제는 PDF 문서의 텍스트 내용을 추출하는 방법을 보여줍니다.
// PDF 내용을 추출하기 위해 TextExtractor 객체 생성
using (TextExtractor extractor = new TextExtractor())
{
// TextFormattingMode (Pure 또는 Raw - 기본값)를 설정하기 위해 TextExtractorOptions 객체 생성
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// 데이터 소스에 입력 파일 경로 추가
extractorOptions.AddInput(new FileDataSource(inputPath));
// 추출 프로세스 수행
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ResultContainer 객체에서 추출된 텍스트 가져오기
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
비고
Aspose.Pdf.Plugins.TextExtractorOptions 객체는 Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode 및 텍스트 추출 작업을 위한 기타 옵션을 설정하는 데 사용됩니다. 또한 입력 PDF 문서를 나타내는 데이터(파일, 스트림)를 추가하는 기능을 상속합니다.
생성자
TextExtractorOptions(TextFormattingMode)
지정된 텍스트 형식 모드에 대한 Aspose.Pdf.Plugins.TextExtractorOptions 객체의 새 인스턴스를 초기화합니다.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
매개변수
formattingMode
TextExtractorOptions.TextFormattingMode
텍스트 형식 모드 값입니다.
TextExtractorOptions()
‘Raw’ (기본값) 텍스트 형식 모드로 Aspose.Pdf.Plugins.TextExtractorOptions 객체의 새 인스턴스를 초기화합니다.
public TextExtractorOptions()
속성
FormattingMode
형식 모드를 가져옵니다.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
속성 값
TextExtractorOptions.TextFormattingMode
OperationName
작업의 이름을 반환합니다.
public override string OperationName { get; }