Cài đặt pentaho trên window 7, 8, 10

Pentaho Data Intergration(PDI) là 1 tools ETL mạnh mẽ dùng để tổng hợp, chuyển đổi và xử lý dữ liệu – nằm trong nhóm công cụ dành cho BI của Pentaho. PDI hiện nay được công ty  phát triển có cả bản thương mại và bản dành cho cộng đồng, bản mới nhất dành cho cộng đồng là bản 8.0. Sau đây là hướng dẫn cài đặt pentaho trên window 10 cho tất cả mọi người.

Đối với Pentaho thì ta không cần cài đặt nó mà có thể chay được ngay nhưng vẫn phải cần môi trường để cho nó có thể chạy được.

Ứng dụng của Pentaho đầu tiên được biết đến là một công cụ ETM mạnh mẽ. Không kể đến bản Pro, bản Free dành cho cộng đồng còn có nhiều tính năng mà ta có thể khai thác để ứng dụng nhiều trong công việc. Một số phải kể đến đó là làm báo cáo, phân tích dữ liệu, ứng dụng Bigdata…

Các tạo môi trường và cài đặt các phần mềm cần thiết

Để chạy được Pentaho PDI dành cho cộng đồng ta cần thực hiện các bước sau:
B1: Cài đặt môi trường JDK để Pentaho có thể chạy được
Tùy theo phiên bản Pentaho PDI ta có thể cài đặt phiên bản JDK phù hợp. Lựa chọn và tải JDK tại địa chỉ: JDK
Hiện tại tôi đang sử dụng phiên bản Pentaho PDI 7.0 với JDK 7
B2: Tải Pentaho PDI và giải nén
Tải phiên bản Pentaho PDI mới nhất tại địa chỉ: PDI
Hoặc các phiên bản cũ hơn: PDI OLD
B3: Tải các JDBC driver để Pentaho PDI có thể giao tiếp với các loại cơ sở dữ liệu
– Oracle: jdbc
– Sqlserver: sqljdbc
– MySQl: mysql-connector-java
B4: Đưa các JDBC driver vào thư muc: data-integration\lib
B5: Bật Pentaho PDI bằng cách chạy file: Spoon.bat trong thư mục: data-integration. Ta sẽ có giao diện chương trình như sau:

Như vậy việc cài đặt pentaho trên window 10 đã xong. Ta có thể bắt đầu sử dụng pentaho để thực hiện các tác vụ mà mình muốn.