Trích xuất dữ liệu từ PDF sang Excel

dữ liệu từ tùy chọn PDF - truy vấn nguồn lấy dữ liệu excel

Trong hướng dẫn này, hãy tìm hiểu cách,

  • Trích xuất dữ liệu dạng bảng từ một tệp PDF sang Excel
  • Kết hợp và trích xuất các bảng từ nhiều PDFS sang Excel
Chúng tôi sẽ sử dụng Excel 365 & Power Query để thực hiện việc này. Nếu bạn có phiên bản Excel khác (2016, 2013 trở lên), hãy đọc phần Câu hỏi thường gặp ở cuối để biết một cách khác để thực hiện việc này.

Cách trích xuất bảng PDF sang Excel

Tùy chọn:   Nếu bạn cần một bản PDF mẫu để thực hành các khái niệm này, hãy sử dụng bảng sao kê thẻ tín dụng được tạo ngẫu nhiên mà tôi đã tạo. Tải xuống chúng từ đây .

Bước 1: Đi tới ruy-băng Dữ liệu và nhấp vào Lấy dữ liệu> Tệp> PDF

Từ dải băng dữ liệu, sử dụng tùy chọn PDF và trỏ đến vị trí trên máy tính của bạn (hoặc địa chỉ web).

dữ liệu từ tùy chọn PDF - truy vấn nguồn lấy dữ liệu excel

Bước 2: Chọn (các) bảng bạn muốn trong màn hình điều hướng

Power Query  sẽ mở ra  màn hình điều hướng. Chỉ cần chỉ định (các) bảng bạn muốn. Tham khảo hình minh họa bên dưới để biết thêm về màn hình điều hướng.

màn hình điều hướng cho pdf - Power query

💡Mẹo bổ sung: Sử dụng bảng tổng hợp nếu bạn muốn có một bảng dữ liệu trong tệp PDF của mình trải dài nhiều trang. Điều này là tuyệt vời cho sao kê ngân hàng hoặc thẻ tín dụng.

Bước 3: Tải hoặc chuyển đổi dữ liệu

Nếu bản xem trước trong điều hướng có vẻ hài lòng, chỉ cần tải nó. Nếu không, hãy nhấp vào “Chuyển đổi dữ liệu” để mở trình chỉnh sửa truy vấn để thực hiện bất kỳ điều chỉnh cuối cùng nào.

Kết hợp và trích xuất dữ liệu từ nhiều tệp PDF

Bước 0: Đặt tất cả các tệp PDF của bạn vào một thư mục

Bước 1: Kết nối thư mục

Thay vì tùy chọn PDF, hãy sử dụng tùy chọn Thư mục trong Lấy dữ liệu.

từ tùy chọn thư mục - lấy dữ liệu - truy vấn nguồn - excel

Bước 2: Chọn “Kết hợp” trong màn hình danh sách tệp

Power Query sẽ hiển thị cho bạn một màn hình với danh sách tất cả các tệp được tìm thấy trong thư mục. Chọn bất kỳ tùy chọn kết hợp nào ở đây để kết hợp dữ liệu từ tất cả các tệp vào một bảng.

Màn hình liệt kê tệp - Power Query - Tùy chọn kết nối thư mục

Bước 3: Chọn bảng bạn muốn từ Màn hình chuyển mẫu

Bây giờ, bạn sẽ thấy một  màn hình giống như một trình điều hướng  khác . Chỉ cần chọn bảng bạn muốn tại đây. Power Query sẽ đi đến từng tệp trong thư mục, lấy cùng một bảng và kết hợp chúng.

Bước 4: Tải hoặc chỉnh sửa truy vấn

Và tận hưởng.

Thực hành bảng sao kê thẻ tín dụng PDF

Nếu bạn cần một bản PDF mẫu để thực hành những khái niệm này, hãy sử dụng bảng sao kê thẻ tín dụng được tạo ngẫu nhiên mà tôi đã tạo. Tải xuống chúng từ đây .

Video – Chuyển đổi PDF sang Excel

Bạn vẫn chưa biết cách trích xuất bảng dữ liệu từ PDF sang Excel? Xem đoạn video ngắn này và lấy nó. Xem nó bên dưới hoặc trên kênh YouTube của tôi .

Chuyển PDF sang Excel – Câu hỏi thường gặp

Tôi không có tùy chọn PDF trong Excel của mình. Tôi làm gì?

Bạn có thể sử dụng Power BI Desktop miễn phí để làm điều tương tự. ( Tải Power BI miễn phí tại đây )

Khi bạn đã có Power BI, hãy mở nó, đi tới Lấy dữ liệu> PDF và làm theo các bước tương tự như hướng dẫn ở trên.

Thay vì tải dữ liệu, hãy sao chép toàn bộ bảng từ Trình soạn thảo truy vấn và dán vào Excel. Xem hình minh họa bên dưới.

sao chép toàn bộ bảng - truy vấn nguồn trong Power BI

Tôi có tệp mới, làm cách nào để làm mới?

Chỉ cần đặt các tệp trong cùng một thư mục.

Đi tới Excel và nhấp chuột phải vào bảng đã trích xuất và chọn “Làm mới”. Excel sẽ cập nhật thông tin chi tiết.

Tôi muốn loại trừ các tệp nhất định trong thư mục khi kết hợp…

Mở trình chỉnh sửa truy vấn và chuyển đến truy vấn chịu trách nhiệm cho quá trình kết hợp PDF của bạn. Chuyển đến bước nguồn. Điều này sẽ hiển thị tất cả các tệp trong thư mục. 

Bao gồm một điều kiện lọc ở đây. Power Query sẽ cảnh báo về việc chèn một bước. Tiếp tục và bạn sẽ có thể loại trừ các tệp dựa trên các điều kiện.

Ví dụ:

  • Xử lý các tệp có tên tệp bắt đầu bằng các chữ cái nhất định
  • Các tệp được tạo sau một ngày nhất định
  • Có phần mở rộng cụ thể.

Hãy nhớ: Power Query phân biệt chữ hoa chữ thường.

Tôi muốn xử lý trước hoặc xóa dữ liệu trước khi tải nó vào Excel

Mở trình chỉnh sửa truy vấn và thêm bất kỳ bước chuyển đổi dữ liệu cần thiết nào vào cuối. 

Ví dụ:

  • Xóa tất cả các giao dịch ngoại tệ khỏi bảng sao kê thẻ tín dụng
  • Xóa mã tài khoản
  • Sắp xếp lại các cột trong bảng dữ liệu PDF

Recommended For You

About the Author: hocketoan