怎樣將pdf裡面的表格提取出來(怎麼把pdf檔案裡面的表格提取出來)

老鐵們,今天分享一個比較實用的小技巧,“如何提取PDF檔案中的表格?“

方法很簡單,大概2分鐘就學會,請耐心往下看,相信對你以後工作有幫助。

01 問題背景

最近看GP行情,就下載了一些研報(PDF格式),其中有大量表格,覺得看資料不是太直觀,所以就想匯入到Excel中來製作成圖表。

   

原始圖片

但是直接複製PDF中表格,貼上到Excel中,格式就不太規範,如下圖所示,所有的資料都在一個單元格內,並沒有分列,這樣就為我們處理資料帶來麻煩,而且即使分列以後,還要重新整理格式,哪該如何處理呢?

   

貼上效果

02 解決辦法

對於文字整理成表格的問題,我就想到了微軟的另外一大辦公軟體:Word,所有可以放到Word裡面來整理,然後再複製到Excel裡面,就可以了;

(1)在PDF中複製上表格,直接貼上到Word裡面(如下圖所示);可以看到文字之間,行列並沒有區分清楚,但是文字之間有分隔符的。

   

Word貼上

(2)剩下的,就是如何將Word中的文字轉換成表格了。選中所有的文字,在插入選項卡下面,選擇表格-文字轉換成表格,此時會彈出一個對話方塊,在裡面選擇分隔符為空格(根據你自己表格情況選擇),列數調整為7(PDF中表格為7列),點確定即可。

   

表格處理

(3)現在就搞定了,結果圖如下,此時我們再複製貼上到Excel中,就可以了,想怎麼作圖都行了。

   

效果圖

03 其他辦法

其實解決這問題,方法很多,包括我以前講過的使用PowerQuery(在文章末尾有連結),也可以使用在Excel中分列,再處理的方法,都是可以的,下次就分享下,如何在Excel中分列,再處理的方式來做,敬請期待;