無償(OSS)のETLツールについて調べてみた

OLYMPUS DIGITAL CAMERA

異なるシステム・データベース・クラウド製品などのデータを連携する仕組みとしてETLツールがあります。
今までに、Power CenterやData Spiderなどの製品については仕事の中で触れたことがありましたが、今回は新しくOSSでETLツールを導入しようと考えており、そのためのツール選定をしています。

そこで、OSSのETLツールがあるのか・・・という根本的な点からWebで調べてみました。

ETLとは?

ちなみにETLとは何か・・・ですが、異なるシステム間でデータ転送する仕組みになります。

  • データ抽出:Extract
  • データ変換:Transform
  • データ取り込み:Load

では、今回具体的に実現したい内容について整理しました。

要件

オンプレミスとパッケージの異なるシステム間のデータを連携したい
オンプレミスと言っているのは基幹系システムで、データベースはMicrosoft SQL Server、そしてパッケージはデータベースにMySQLを使っています。簡単に言ってしまうとSQL Server(Windows Server)からMySQL(Linux Server)へのデータ転送を実現したいのです。
なるべくリアルタイムに近い形で情報連携したい
ジョブの管理もできればやってくれると嬉しいと考えています。

ETL製品リスト

ざっとETL製品をリストアップしてみました。
OSSつまり、無償のソフトは「Talend」とリストに入れるか迷った「Spring Batch」くらいですね。
本当は、それぞれの製品特徴や値段を整理できると良いのでしょうが・・・
時間的にも厳しいので、まずはここまでにしたいと思います。

次は「Talend」と「Spring Batch」について、もう少し調べてみようかな・・・と思っています。

製品 会社 無償OSS?
talend Talend株式会社
InfoSphere DataStage IBM
PowerCenter infomatica
DataSpider Servista 株式会社アプレッソ
ASTERIA インフォテリア株式会社
Waha! Transformar 株式会社ビーコン インフォメーション テクノロジー
高速機関 株式会社高速屋
Sagent Data Flow ピツニーボウズ・ソフトウェア株式会社
DMX Syncsort
Spring Batch* Spring Team
ETL Suite ADEPTIA

*Spring BatchはETLツールとして紹介されている記事は無いが、単純にデータ連携という意味で考えると対象となるのかな。。と思い、入れてみました。
**順番に意味はありません。意味づけしたいところですが・・・

Pocket
LINEで送る

  1. コメントはまだありません。

  1. 2013年 12月 19日

CAPTCHA