無償(OSS)のETLツールについて調べてみた

IT Strategy

異なるシステム・データベース・クラウド製品などのデータを連携する仕組みとしてETLツールがあります。
今までに、Power CenterやData Spiderなどの製品については仕事の中で触れたことがありましたが、今回は新しくOSSでETLツールを導入しようと考えており、そのためのツール選定をしています。

そこで、OSSのETLツールがあるのか・・・という根本的な点からWebで調べてみました。

ETLとは?

ちなみにETLとは何か・・・ですが、異なるシステム間でデータ転送する仕組みになります。

  • データ抽出:Extract
  • データ変換:Transform
  • データ取り込み:Load

では、今回具体的に実現したい内容について整理しました。

要件

オンプレミスとパッケージの異なるシステム間のデータを連携したい
オンプレミスと言っているのは基幹系システムで、データベースはMicrosoft SQL Server、そしてパッケージはデータベースにMySQLを使っています。簡単に言ってしまうとSQL Server(Windows Server)からMySQL(Linux Server)へのデータ転送を実現したいのです。
なるべくリアルタイムに近い形で情報連携したい
ジョブの管理もできればやってくれると嬉しいと考えています。

ETL製品リスト

ざっとETL製品をリストアップしてみました。
OSSつまり、無償のソフトは「Talend」とリストに入れるか迷った「Spring Batch」くらいですね。
本当は、それぞれの製品特徴や値段を整理できると良いのでしょうが・・・
時間的にも厳しいので、まずはここまでにしたいと思います。

次は「Talend」と「Spring Batch」について、もう少し調べてみようかな・・・と思っています。

製品 会社 無償OSS?
talend Talend株式会社
InfoSphere DataStage IBM
PowerCenter infomatica
DataSpider Servista 株式会社アプレッソ
ASTERIA インフォテリア株式会社
Waha! Transformar 株式会社ビーコン インフォメーション テクノロジー
高速機関 株式会社高速屋
Sagent Data Flow ピツニーボウズ・ソフトウェア株式会社
DMX Syncsort
Spring Batch* Spring Team
ETL Suite ADEPTIA

*Spring BatchはETLツールとして紹介されている記事は無いが、単純にデータ連携という意味で考えると対象となるのかな。。と思い、入れてみました。
**順番に意味はありません。意味づけしたいところですが・・・

コメント

  1. […] 前回OSSのETLツールについて調査しましたが、結局OSSのETLツールとなるとTalendくらいしかない事がわかりましたので、とりあえず使えるかどうかダウンロードするところから始めてみたい […]