Study SAS

統計解析ソフトウェアSASについて学習したことのまとめやSAS認定試験対策など

rawデータファイル読み込み時の文字エンコーディング設定

Linuxで作成したeucエンコードのファイルをWindowsSASで取り込む際にはエンコーディング変換が必要

[eucエンコーディングのrawデータファイル]
あいうえお
かきくけこ
さしすせそ
data temp;
    infile 'data_euc.txt';
    format text $16.;
    input text $;
run;

そのままデータセットを作成すると文字化けする

Obs text
1 、「、、、ヲ、ィ、ェ
2 、ォ、ュ、ッ、ア、ウ
3 、オ、キ、ケ、サ、ス

encodingオプションとtermstrオプションでエンコーディングと改行コードを設定すると、正しくデータセットを作成することができる。

data temp;
    infile 'data_euc.txt' encoding='euc-jp' termstr=lf;
    format text $16.;
    input text $;
run;
Obs text
1 あいうえお
2 かきくけこ
3 さしすせそ