1.3 欠損値処理

自然を相手に観測などする場合, 観測機器の不調等により正常にデータが取れない場合がある. そのような場合, 本来データを書くべきところに, 特定のある数値 (例えば999.) を書いて, 正常にデータが取れていないことを示すことがある. この「正常なデータでない」ことを意味する数値が欠損値である. 地球流体電脳ライブラリの多くのパッケージでは, このような欠損値を含むデータを直接扱うことができる.

例えば, 次のようなデータがあったとしよう.



日最高気温の月平均値  
$\backslash$観測点 札幌 仙台 東京 名古屋 京都 福岡 鹿児島
1月 -1.1 5.0 9.5 8.4 999. 9.3 12.2
7月 24.8 25.6 28.8 999. 999. 30.6 31.4



1月の京都, 7月の名古屋, 京都の 999. は データが正常に得られなかったことを示している. 1月, 7月それぞれの月のデータを配列T1, T7に読み込んで 平均値を算出するとき, 999. まで有効なデータとして扱ってしまうと, とんでもない値が算出されてしまう. そこで, 以下のように GLpGET/GLpSETが管理する内部変数'LMISS'.TRUE.として(初期値は.FALSE.) RFALIBのRAVEを用いれば, 999. を除いた平均値が算出できる.

      CALL GLLSET('LMISS', .TRUE.)
      TAVE1 = RAVE(T1, 7, 1)
      TAVE7 = RAVE(T7, 7, 1)

なお, 欠損値処理をおこなうことができる関数では, すべての配列要素が欠損値のときは欠損値が返される.



また, VRBLIBのVRADDを用いて 配列T1T7の和をTXとして求めるときは,

 

      CALL GLLSET('LMISS', .TRUE.)
      CALL VRADD(T1, T7, TX, 7, 1, 1, 1)

としてやればよい. 'LMISS'.TRUE.としたとき, VRADDT1およびT7の配列要素の少なくとも どちらかが欠損値ならば欠損値を返すようになっているので, この場合, 名古屋, 京都に対応するTXの配列要素は 欠損値となる.



欠損値は GLpGET/GLpSETが管理する内部変数 'RMISS'で指定され, 初期値は 999. である. 999. という値は, 気温としては本来ありえない値なので, 気温データなどの場合には問題はないが, この値がデータの範囲に入ってしまうような場合には, 'RMISS'の値を変更しておく必要がある.