目次

内容

概要

Talend Open Studio

  • オープンソースのETL(データ加工)ツール
  • GUIでデータソースや加工(ソート・抽出・連結、など)が実現できる
  • テキストファイルやDBだけでなく、Webサービスもデータソースが指定できる
  • WindowsとLinux(要XWindow)で動作
  • 上位製品の「Talend Integration Suite」を使うと、もっと複雑なことができるらしい

インストール

Windows版の場合

  • Windows版を次のURLからダウンロード
  • ダブルクリックしてインストーラを起動
    • インストール先は「C:\Program Files」を指定すると「TOS-Win32-r50363-V4.1.1」というフォルダが作成される。
  • インストールが完了したら「TalendOpenStudio-win32-x86.exe(64bit版ならx86_64.exe)」をダブルクリックして起動

簡単な使い方

  • とりあえずCSVを読み込んで出力するサンプル

ジョブの作成

  • リポジトリ内の「Job Designs」を右クリックして「ジョブの作成」を選択
01.png
  • 名前と目的だけは指定しておく

データソースの指定

  • 画面左のパレットから「File」→「Input」→「tFileInputDelimited」をワークスペースにドラッグ&ドロップ
02.png
03.png
  • アイコンをダブルクリックし、画面下のプロパティでCSVのオプションを指定
04.png
  • CSVオプションにチェックを入れると、さらに細かい条件が指定できる

CSVのフィールド定義

  • プロパティタイプの横にあるフロッピーのボタンをクリック
    • ステップ1でデータを確認
05.png
  • ステップ2でCSVの細かい条件を指定
06.png
  • ステップ3でフィールドとデータの中身を確認
07.png
  • ステップ4でフィールドの名称と型を指定
08.png

アウトプットの定義

  • 画面左のパレットから「File」→「Output」→「tFileOutputDelimited」をワークスペースにドラッグ&ドロップ
  • アウトプットのアイコンをダブルクリックし、プロパティで出力条件を指定
    • 「シンクカラム」をクリックして入力と出力のカラムを同期しておく。

データ出力の実行

  • インプットのアイコンを右クリックで「ロウ」→「Main」を選択
09.png
  • 線をアウトプットのアイコンにつなげる
10.png
  • 画面左上の「実行」をクリック
11.png

使用上の注意

エンコーディング

  • 日本語を利用する場合は、設定の「Talend」>「Specific Settings」にある「Allow specific charactors (UTF8,...) for columns of schemas」にチェックを入れる。
12.png
  • エンコーディングを変えて出力する場合、出力コンポーネントのプロパティにある「Advanced settings」の「エンコーディングタイプ」で「Custom」を選択し、出力エンコード名を入力する。
13.png

添付ファイル: file07.png 70件 [詳細] file08.png 72件 [詳細] file05.png 74件 [詳細] file12.png 73件 [詳細] file09.png 73件 [詳細] file01.png 184件 [詳細] file03.png 154件 [詳細] file06.png 72件 [詳細] file10.png 70件 [詳細] file00.png 204件 [詳細] file11.png 72件 [詳細] file13.png 65件 [詳細] file02.png 158件 [詳細] file04.png 135件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2016-09-25 (日) 19:27:03 (442d)