跳至主內容

HWPX 文字擷取器

從 HWPX 檔案擷取文字和圖片並轉換為各種格式的工具。

💡 什麼是HWPX檔案?

韓文2014及更高版本中使用的基於XML的檔案格式。

한글 파일을 HWPX로 저장하려면: 파일 → 다른 이름으로 저장 → HWPX 형식

主要功能

  • 完整擷取 HWPX 檔案文字
  • 擷取圖片並下載
  • 轉換為各種格式(TXT、Markdown、HTML)
  • 顯示文件詮釋資料
  • 剪貼簿複製功能
  • 100% 客戶端處理

什麼是 HWPX?

HWPX 是韓文 2014 以上版本支援的 XML 基礎韓文檔案格式。

HWP vs HWPX

格式版本結構是否可擷取
HWP韓文 97-2010二進位有限
HWPX韓文 2014+ZIP + XML可以

使用方法

1. 將 HWP 轉換為 HWPX

在韓文程式中:

檔案 → 另存新檔 → 格式:選擇 HWPX

2. 上傳檔案

  • 點擊選擇檔案按鈕
  • 選擇 HWPX 檔案

3. 確認結果

  • 文件資訊(作者、頁數、字數)
  • 擷取的文字
  • 文件中的圖片

4. 下載為所需格式

  • TXT:純文字
  • Markdown:Markdown 格式
  • HTML:網頁文件格式
  • 複製:複製到剪貼簿

使用情境

1. 無韓文程式確認文件內容

上傳 HWPX 檔案 → 擷取文字 → 確認內容
在未安裝韓文程式的環境中很有用

2. 轉換為其他格式

HWPX → TXT/Markdown/HTML
為了在其他編輯器或平台使用而轉換

3. 活用文字資料

HWPX → 擷取文字 → 分析/搜尋/翻譯
以程式處理文件內容時

4. 擷取圖片

HWPX → 擷取圖片檔案
僅另外儲存文件中包含的圖片

支援功能

支援

  • 完整擷取文字
  • 擷取圖片(PNG、JPG、GIF)
  • 文件詮釋資料
  • 多區段文件
  • 特殊字元、中文、英文、數字

限制

  • 不包含格式資訊(粗體、色彩等)
  • 不支援表格/圖形排版
  • 公式、圖表文字化
  • 不支援 HWP 檔案(舊版)

技術資訊

處理方式

1. 上傳 HWPX 檔案

2. 解壓縮 ZIP

3. 解析 XML 檔案

4. 擷取文字/圖片

5. 轉換為各種格式

使用技術

  • JSZip:解壓縮 HWPX(ZIP)
  • fast-xml-parser:XML 解析
  • FileSaver:檔案下載
  • 客戶端:所有處理都在瀏覽器中進行

隱私

  • 100% 客戶端處理
  • 檔案不會傳送到伺服器
  • 個人資訊安全
  • 離線也可運作

常見問題

Q:也支援 HWP 檔案嗎?

A:目前僅支援 HWPX 檔案。HWP 檔案請在韓文程式中另存為 HWPX 後使用。

Q:格式(粗體、色彩等)也會保留嗎?

A:不會,僅擷取純文字。如需格式,請使用 HWP 檢視器

Q:檔案會上傳到伺服器嗎?

A:不會!所有處理都在瀏覽器中進行,檔案不會傳送到外部。

Q:擷取的文字很奇怪

A:HWPX 檔案可能損壞或排版非常複雜。請儘可能用簡單的文件測試。

Q:表格或圖形會如何?

A:會擷取表格的文字,但不會保留排版。圖形可另外擷取。

Q:可以轉換為 PDF 嗎?

A:目前版本僅支援 TXT/MD/HTML。下載為 HTML 後可在瀏覽器中列印為 PDF。

相關工具

瀏覽器支援

  • Chrome 90+
  • Firefox 90+
  • Safari 14+
  • Edge 90+
  • 行動瀏覽器

應用技巧

技巧 1:批次處理文件

處理多個文件時,在韓文程式中批次轉換為 HWPX 後逐一上傳。

技巧 2:文字分析

複製擷取的文字可與其他文字分析工具連結。

技巧 3:備份用

重要文件以 HWPX 和 TXT 兩種格式備份較為安全。

技巧 4:行動確認

在行動裝置上需要確認韓文文件時,轉換為 HTML 較為方便。

💬 這個工具對您有幫助嗎?

歡迎隨時向我們發送您的意見或建議!