Docpler
사용법

MarkItDown

MarkItDown과 함께 사용하기

기본 사용법

from markitdown import MarkItDown

md = MarkItDown(enable_plugins=True)
result = md.convert("document.hwp")
print(result.text_content)

enable_plugins=True가 필요합니다.

다른 포맷과 함께 사용

MarkItDown은 다양한 포맷을 지원합니다. markitdown-hwp를 설치하면 PDF, DOCX, PPTX 등과 함께 HWP 파일도 자동으로 처리됩니다.

md = MarkItDown(enable_plugins=True)

# 모두 동작합니다
md.convert("report.hwp")
md.convert("slides.pptx")
md.convert("paper.pdf")

파일 감지

플러그인은 다음으로 HWP 파일을 인식합니다:

  • 파일 확장자: .hwp
  • MIME 타입: application/x-hwp, application/haansofthwp, application/vnd.hancom.hwp

On this page