맥이나 윈도우에서 HWP 파일을 마크다운 형식으로 변환하려면 한컴을 유료로 결제하고 사용해야 합니다. 그러나 수정을 하지 않고 안에 있는 내용을 볼 때는 무료인 Polaris Office를 이용해 내용을 볼 수 있습니다.
그런데 문제는 이 워드 파일을 다른 용도로 사용하여 재가공하거나 그 안에 있는 데이터를 추출 해 사용하려면 마크다운(Markdown) 형식으로 파일을 변환하는 것이 편리합니다.
맥에서 HWP 파일을 마크다운 형식으로 바꾸는 방법을 알아봅니다.
맥에 기본적으로 Homebrew가 설치되어 있어야합니다.
그리고 반드시 가상환경에서 실행하세요.

1. 실패
터미널을 이용해 시도했는데 잘 되지 않아 변환사이트를 활용해 하겠습니다.
터미널을 이용해 가능한 방법을 아시는분이라면 공유 부탁합니다.
2. 순서
1. hwp -> PDF 변환
2. 파이썬을 이용해 변환
1. hwp -> PDF 변환
먼저 변환사이트를 이용해 hwp 파일을 PDF 파일로 변환을 하겠습니다.
HWP 파일을 PDF로 변환하려면 AllinPDF를 이용하세요
위 링크를 통해 HWP PDF 변환을 통해 파일을 PDF 파일로 전환을 합니다.
2. 파이썬을 이용해 변환
메모장으로 “convert_pdf_to_md.py” 파일을 원하는 위치에 만들고 저정합니다. 파일이름은 바꾸셔도 됩니다.
저는 빨간색으로 표시된 /Users/kor/Downloads/pro 위치에 같이 만들었습니다.
import fitz # PyMuPDF
from markdownify import markdownify as md
# PDF 파일 경로
pdf_path = '/Users/kor/Downloads/pro/test.pdf'
markdown_output_path = '/Users/kor/Downloads/pro/test.md'
# PDF 파일 열기
with fitz.open(pdf_path) as pdf_document:
pdf_text = ""
for page_num in range(len(pdf_document)):
page = pdf_document.load_page(page_num)
pdf_text += page.get_text()
# 텍스트를 마크다운 형식으로 변환
markdown_text = md(pdf_text)
# 마크다운 파일로 저장
with open(markdown_output_path, 'w') as md_file:
md_file.write(markdown_text)
print(f"Markdown file saved at: {markdown_output_path}")
이제 저장된 파일을 실행해 줍니다.
본인이 저장한 파일 위치를 지정해주면 됩니다.
저는 ‘/Users/kor/Downloads/pro/‘ 폴더 안에 ‘convert_pdf_to_md.py’ 라고 저장했었습니다.
아래 처럼 터미널에 입력하고 엔터를 칩니다. convert_pdf_to_md.py 파일이 실행됩니다.
python /Users/kor/Downloads/pro/convert_pdf_to_md.py
폴더를 확인해 보면 파일이 변환되었을 것입니다.
저는 ‘/Users/kor/Downloads/pro/’ 폴더속에 test.md 라고 마크다운 형식 파일이 저정되었습니다.
과정 처음엔 조금 복잡한데, 한두번 해보면 쉽습니다.
이렇게 해서 쉽게 hwp 파일을 마크다운 형식으로 쉽게 변환했습니다.

