본문으로 건너뛰기

HWPX 텍스트 추출기

HWPX 파일에서 텍스트와 이미지를 추출하고 다양한 형식으로 변환하는 도구입니다.

💡 HWPX 파일이란?

한글 2014 이상에서 사용하는 XML 기반 파일 형식입니다.

한글 파일을 HWPX로 저장하려면: 파일 → 다른 이름으로 저장 → HWPX 형식

주요 기능

  • HWPX 파일 텍스트 완벽 추출
  • 이미지 추출 및 다운로드
  • 다양한 형식 변환 (TXT, Markdown, HTML)
  • 문서 메타데이터 표시
  • 클립보드 복사 기능
  • 100% 클라이언트 사이드 처리

HWPX란?

HWPX는 한글 2014 이상에서 지원하는 XML 기반의 한글 파일 형식입니다.

HWP vs HWPX

형식버전구조추출 가능 여부
HWP한글 97-2010바이너리⚠️ 제한적
HWPX한글 2014+ZIP + XML✅ 가능

사용 방법

1. HWP를 HWPX로 변환

한글 프로그램에서:

파일 → 다른 이름으로 저장 → 형식: HWPX 선택

2. 파일 업로드

  • 📎 파일 선택 버튼 클릭
  • HWPX 파일 선택

3. 결과 확인

  • 📊 문서 정보 (작성자, 페이지 수, 글자 수)
  • 📝 추출된 텍스트
  • 🖼️ 문서 내 이미지

4. 원하는 형식으로 다운로드

  • TXT: 순수 텍스트
  • Markdown: 마크다운 형식
  • HTML: 웹 문서 형식
  • 복사: 클립보드에 복사

사용 시나리오

1. 한글 없이 문서 내용 확인

HWPX 파일 업로드 → 텍스트 추출 → 내용 확인
한글 프로그램이 설치되지 않은 환경에서 유용

2. 다른 형식으로 변환

HWPX → TXT/Markdown/HTML
다른 에디터나 플랫폼에서 사용하기 위해 변환

3. 텍스트 데이터 활용

HWPX → 텍스트 추출 → 분석/검색/번역
문서 내용을 프로그래밍으로 처리할 때

4. 이미지 추출

HWPX → 이미지 파일 추출
문서에 포함된 이미지만 따로 저장

지원 기능

✅ 지원됨

  • ✅ 텍스트 완벽 추출
  • ✅ 이미지 추출 (PNG, JPG, GIF)
  • ✅ 문서 메타데이터
  • ✅ 다중 섹션 문서
  • ✅ 특수문자, 한글, 영문, 숫자

⚠️ 제한사항

  • ⚠️ 서식 정보 (굵기, 색상 등) 미포함
  • ⚠️ 표/그림 레이아웃 미지원
  • ⚠️ 수식, 차트 텍스트화
  • ⚠️ HWP 파일 (구버전) 미지원

기술 정보

처리 방식

1. HWPX 파일 업로드

2. ZIP 압축 해제

3. XML 파일 파싱

4. 텍스트/이미지 추출

5. 다양한 형식으로 변환

사용 기술

  • JSZip: HWPX(ZIP) 압축 해제
  • fast-xml-parser: XML 파싱
  • FileSaver: 파일 다운로드
  • 클라이언트 사이드: 모든 처리가 브라우저에서 진행

프라이버시

  • ✅ 100% 클라이언트 사이드 처리
  • ✅ 파일이 서버로 전송되지 않음
  • ✅ 개인정보 안전
  • ✅ 오프라인에서도 작동 가능

자주 묻는 질문

Q: HWP 파일도 지원하나요?

A: 현재는 HWPX 파일만 지원합니다. HWP 파일은 한글 프로그램에서 HWPX로 저장한 후 사용하세요.

Q: 서식(굵기, 색상 등)도 유지되나요?

A: 아니요, 순수 텍스트만 추출됩니다. 서식이 필요하면 HWP 뷰어를 사용하세요.

Q: 파일이 서버로 업로드되나요?

A: 아니요! 모든 처리가 브라우저에서 진행되어 파일이 외부로 전송되지 않습니다.

Q: 추출된 텍스트가 이상해요

A: HWPX 파일이 손상되었거나 매우 복잡한 레이아웃일 수 있습니다. 가능한 한 단순한 문서로 테스트해보세요.

Q: 표나 그림은 어떻게 되나요?

A: 표의 텍스트는 추출되지만 레이아웃은 유지되지 않습니다. 그림은 별도로 추출 가능합니다.

Q: PDF로 변환할 수 있나요?

A: 현재 버전에서는 TXT/MD/HTML만 지원합니다. HTML로 다운로드 후 브라우저에서 PDF로 인쇄하실 수 있습니다.

관련 도구

  • HWP 뷰어 - HWP/HWPX 파일 미리보기 (서식 포함)

브라우저 지원

  • ✅ Chrome 90+
  • ✅ Firefox 90+
  • ✅ Safari 14+
  • ✅ Edge 90+
  • ✅ 모바일 브라우저

활용 팁

💡 팁 1: 대량 문서 처리

여러 문서를 처리할 때는 한글 프로그램에서 일괄 HWPX 변환 후 하나씩 업로드하세요.

💡 팁 2: 텍스트 분석

추출된 텍스트를 복사하여 다른 텍스트 분석 도구와 연계할 수 있습니다.

💡 팁 3: 백업용

중요한 문서는 HWPX와 TXT 두 가지 형식으로 백업하면 안전합니다.

💡 팁 4: 모바일 확인

모바일에서 한글 문서를 확인해야 할 때 HTML로 변환하면 편리합니다.