Slowly Changing Dimension(SCD)

なんとなく響きがカッコいいんですよ。
訳すと「緩やかに変化する次元」


通常、データを分析する場合、店舗、日付、商品などの項目で分けて分析します。
この項目のことを分析軸と呼びます。
分析軸を扱う場合において大きな問題があります。それは店舗にしろ、商品にしろ変化する、ということです。
この分析軸の変化する問題を扱った方法論が「Slowly Changing Dimension」というわけです。


SCDには、以下の3つのタイプがあります。分析軸の取扱状況に合わせて、採用するタイプを選択することになります。

  • Type1 最新の値で分析できる
  • Type2 データ発生当時の値で分析できる
  • Type3 最新の値とデータ発生当時の値で分析できる


こんな仕組のなかで、店舗コードが変わってしまった店舗や合併した店舗を連続的に分析したりします。
ただ、分割された店舗はなんともしがたいんですよね。トランザクション・レベルのデータを逐次割り振るなんてことは実際問題として不可能ですから。
ITがいくら進化してもなんともならん問題もあるってことですね。