怎樣將pdf裡面的表格提取出來(怎麼把pdf檔案裡面的表格提取出來)
老鐵們,今天分享一個比較實用的小技巧,“如何提取PDF檔案中的表格?“
方法很簡單,大概2分鐘就學會,請耐心往下看,相信對你以後工作有幫助。
01 問題背景
最近看GP行情,就下載了一些研報(PDF格式),其中有大量表格,覺得看資料不是太直觀,所以就想匯入到Excel中來製作成圖表。
原始圖片
但是直接複製PDF中表格,貼上到Excel中,格式就不太規範,如下圖所示,所有的資料都在一個單元格內,並沒有分列,這樣就為我們處理資料帶來麻煩,而且即使分列以後,還要重新整理格式,哪該如何處理呢?
貼上效果
02 解決辦法
對於文字整理成表格的問題,我就想到了微軟的另外一大辦公軟體:Word,所有可以放到Word裡面來整理,然後再複製到Excel裡面,就可以了;
(1)在PDF中複製上表格,直接貼上到Word裡面(如下圖所示);可以看到文字之間,行列並沒有區分清楚,但是文字之間有分隔符的。
Word貼上
(2)剩下的,就是如何將Word中的文字轉換成表格了。選中所有的文字,在插入選項卡下面,選擇表格-文字轉換成表格,此時會彈出一個對話方塊,在裡面選擇分隔符為空格(根據你自己表格情況選擇),列數調整為7(PDF中表格為7列),點確定即可。
表格處理
(3)現在就搞定了,結果圖如下,此時我們再複製貼上到Excel中,就可以了,想怎麼作圖都行了。
效果圖
03 其他辦法
其實解決這問題,方法很多,包括我以前講過的使用PowerQuery(在文章末尾有連結),也可以使用在Excel中分列,再處理的方法,都是可以的,下次就分享下,如何在Excel中分列,再處理的方式來做,敬請期待;