2014年1月20日月曜日

指定した日数以前のファイル削除

例えば14日以前のファイルを削除する場合はこんな感じで。

LOG_PATH=~/log

LOG_KEEP_DAYS=14

find ${LOG_PATH} -name '*.log'  -mtime +${LOG_KEEP_DAYS} -exec rm -f {} \;


先ずはダミーファイルを用意して動作確認してから使う事を強く推奨します。

動作確認 : Solaris 8

2014年1月19日日曜日

Pentaho Data Integration, 巨大なXMLファイルの読み込み

Pentaho Data IntegrationでXMLファイルを読み込むにはGet Data from XMLとXML Input Stream(StAX)があります。
600MBぐらいある巨大なXMLファイルをGet Data from XMLで読み込むとjava.lang.OutOfMemoryError: Java heap spaceでエラーが出ました。 メモリ割当を2.5GBまで増やしても解決しません。


この様な大きなファイルの場合、XML Input Stream(StAX)を使う事が推奨されています。
ただXML Input Streamでは親子関係のデータを取るには以下の様にステップを組み合わせる必要があります。

2014年1月13日月曜日

Pentaho Data IntegrationをMacで使う

本格的にMacで使いだすと色々と問題が見つかりました。

起動はダブルクリックでは無く、ターミナルから下記のコマンドを入力
/Applications/Pentaho/data-integration-4.4.0
./spoon.sh

Variableをドロップダウンから選択するにはCommand+Spaceを押す。
ただしSpotとことえりのショートカットと重なっているので無効化させておく。