Originally posted on 27/03/2022 @ 16:10
Trong hướng dẫn này, hãy tìm hiểu cách,
- Trích xuất dữ liệu dạng bảng từ một tệp PDF sang Excel
- Kết hợp và trích xuất các bảng từ nhiều PDFS sang Excel
Cách trích xuất bảng PDF sang Excel
Tùy chọn: Nếu bạn cần một bản PDF mẫu để thực hành các khái niệm này, hãy sử dụng bảng sao kê thẻ tín dụng được tạo ngẫu nhiên mà tôi đã tạo. Tải xuống chúng từ đây .
Bước 1: Đi tới ruy-băng Dữ liệu và nhấp vào Lấy dữ liệu> Tệp> PDF
Từ dải băng dữ liệu, sử dụng tùy chọn PDF và trỏ đến vị trí trên máy tính của bạn (hoặc địa chỉ web).
Bước 2: Chọn (các) bảng bạn muốn trong màn hình điều hướng
Power Query sẽ mở ra màn hình điều hướng. Chỉ cần chỉ định (các) bảng bạn muốn. Tham khảo hình minh họa bên dưới để biết thêm về màn hình điều hướng.
?Mẹo bổ sung: Sử dụng bảng tổng hợp nếu bạn muốn có một bảng dữ liệu trong tệp PDF của mình trải dài nhiều trang. Điều này là tuyệt vời cho sao kê ngân hàng hoặc thẻ tín dụng.
Bước 3: Tải hoặc chuyển đổi dữ liệu
Nếu bản xem trước trong điều hướng có vẻ hài lòng, chỉ cần tải nó. Nếu không, hãy nhấp vào “Chuyển đổi dữ liệu” để mở trình chỉnh sửa truy vấn để thực hiện bất kỳ điều chỉnh cuối cùng nào.
Kết hợp và trích xuất dữ liệu từ nhiều tệp PDF
Bước 0: Đặt tất cả các tệp PDF của bạn vào một thư mục
Bước 1: Kết nối thư mục
Thay vì tùy chọn PDF, hãy sử dụng tùy chọn Thư mục trong Lấy dữ liệu.
Bước 2: Chọn “Kết hợp” trong màn hình danh sách tệp
Power Query sẽ hiển thị cho bạn một màn hình với danh sách tất cả các tệp được tìm thấy trong thư mục. Chọn bất kỳ tùy chọn kết hợp nào ở đây để kết hợp dữ liệu từ tất cả các tệp vào một bảng.
Bước 3: Chọn bảng bạn muốn từ Màn hình chuyển mẫu
Bây giờ, bạn sẽ thấy một màn hình giống như một trình điều hướng khác . Chỉ cần chọn bảng bạn muốn tại đây. Power Query sẽ đi đến từng tệp trong thư mục, lấy cùng một bảng và kết hợp chúng.
Bước 4: Tải hoặc chỉnh sửa truy vấn
Và tận hưởng.
Thực hành bảng sao kê thẻ tín dụng PDF
Nếu bạn cần một bản PDF mẫu để thực hành những khái niệm này, hãy sử dụng bảng sao kê thẻ tín dụng được tạo ngẫu nhiên mà tôi đã tạo. Tải xuống chúng từ đây .
Video – Chuyển đổi PDF sang Excel
Bạn vẫn chưa biết cách trích xuất bảng dữ liệu từ PDF sang Excel? Xem đoạn video ngắn này và lấy nó. Xem nó bên dưới hoặc trên kênh YouTube của tôi .
Chuyển PDF sang Excel – Câu hỏi thường gặp
Tôi không có tùy chọn PDF trong Excel của mình. Tôi làm gì?
Bạn có thể sử dụng Power BI Desktop miễn phí để làm điều tương tự. ( Tải Power BI miễn phí tại đây )
Khi bạn đã có Power BI, hãy mở nó, đi tới Lấy dữ liệu> PDF và làm theo các bước tương tự như hướng dẫn ở trên.
Thay vì tải dữ liệu, hãy sao chép toàn bộ bảng từ Trình soạn thảo truy vấn và dán vào Excel. Xem hình minh họa bên dưới.
Tôi có tệp mới, làm cách nào để làm mới?
Chỉ cần đặt các tệp trong cùng một thư mục.
Đi tới Excel và nhấp chuột phải vào bảng đã trích xuất và chọn “Làm mới”. Excel sẽ cập nhật thông tin chi tiết.
Tôi muốn loại trừ các tệp nhất định trong thư mục khi kết hợp…
Mở trình chỉnh sửa truy vấn và chuyển đến truy vấn chịu trách nhiệm cho quá trình kết hợp PDF của bạn. Chuyển đến bước nguồn. Điều này sẽ hiển thị tất cả các tệp trong thư mục.
Bao gồm một điều kiện lọc ở đây. Power Query sẽ cảnh báo về việc chèn một bước. Tiếp tục và bạn sẽ có thể loại trừ các tệp dựa trên các điều kiện.
Ví dụ:
- Xử lý các tệp có tên tệp bắt đầu bằng các chữ cái nhất định
- Các tệp được tạo sau một ngày nhất định
- Có phần mở rộng cụ thể.
Hãy nhớ: Power Query phân biệt chữ hoa chữ thường.
Tôi muốn xử lý trước hoặc xóa dữ liệu trước khi tải nó vào Excel
Mở trình chỉnh sửa truy vấn và thêm bất kỳ bước chuyển đổi dữ liệu cần thiết nào vào cuối.
Ví dụ:
- Xóa tất cả các giao dịch ngoại tệ khỏi bảng sao kê thẻ tín dụng
- Xóa mã tài khoản
- Sắp xếp lại các cột trong bảng dữ liệu PDF