2021年10月07日

◆ 移動平均のズレ

 コロナの感染者数のグラフでは、「移動平均」というものが現れるが、これは実際の平均値と比べて、若干のズレが生じる。

 ――

 コロナの感染者数のグラフでは、「移動平均」というものが現れる。たとえば、下記のグラフだ。(東京都の感染者数)


ido-heikin.jpg
NHK「東京都の感染者数」


 黄色の棒線の値は、各日の感染者数である。
 灰色の線は、1週間分の移動平均である。これは、各日の感染者数のバラツキを、ならしたものであると見なせる。(ギザギザをなだらかにする効果がある。)

 たとえば、9月17日の移動平均とは、
   11日、12日、13日、14日、15日、16日、17日

 という各日の数値の平均値である。

 しかし、これは、「14日を中心とした、その前後3日間の平均値」のことだ。(これを「区間平均」と呼ぼう。)
 つまり、17日の「移動平均」とは、14日の「区間平均」のことであるから、真の平均値である区間平均よりも、3日間だけ先行していることになる。

 したがって、グラフの上に示される灰色の線の日付は、真の平均値である区間平均よりも3日間だけ先行していることになる。逆に言えば、真の平均値である区間平均は、グラフの上に示される灰色の線の日付よりも3日間だけ遅いことになる。つまり、本当のグラフは、実際のグラフよりも、3日分だけ左にずらして考えるべきなのだ。

 このことが顕著になるのは、グラフの上昇局面と下降局面だ。灰色のグラフを、3日分だけ左にずらして新曲線を考えると、次のようになる。
  ・ グラフの上昇曲面では、新曲線は、灰色の線よりも上に来る。
  ・ グラフの下降曲面では、新曲線は、灰色の線よりも下に来る。


 このような新曲線こそが、真の平均値(区間平均)であって、その値が「バラツキを ならした値」になるのだ。
 逆に言えば、現在の灰色のグラフは、グラフの上昇曲面やグラフの下降曲面では、正しい値よりも少し上下にズレた値を示しているのである。そのズレを補正することが必要だ。

 移動平均のグラフを見たときには、そのグラフをそのまま受け取るべきではなく、上記のように3日分の補正を加えて受け取ることが必要だ。
 その補正は、グラフの上昇局面や下降局面では、特に必要となる。



 [ 付記1 ]
 「移動平均」は、 moving average の翻訳だが、この英語は直訳すると、「動く平均」である。全体の平均ではなく、特定の区間の平均であり、それが区間を変えるにしたがって、次々と動くから、 moving average と呼ばれるわけだ。
 この意味で訳すなら、「動的平均」と訳す方が妥当に思えるが、「動的平均」だと、 dynamic average の訳であると誤解されそうなので、「移動平均」という言葉を使ったのだろう。
 あまり良い訳ではない。「区間平均」の方が妥当な訳語だろう。
 ただし本項では、「区間平均」という語を、別の意味で使っている。(移動平均に比べて3日分のズレのある値を、そう呼んでいる。)

 [ 付記2 ]
 ズレの日数はなぜ、7日の半分である 3.5日でなく、3日なのか? 
 それは、日数がある日を中心とした前後 2n日だからである。
 たとえば、7日間の区間平均を取るときには、ある日の前後3日分を取るから、その「ある日」を含めて、「2×3+1」日の値を取る。
 だから、2n+1 日に対しては、前後 n日を取るので、ズレの値は n となる。ここで n=3 を代入して、7日間に対しては 3日のズレがあるとわかる。

posted by 管理人 at 23:20| Comment(3) |  感染症・コロナ | 更新情報をチェックする
この記事へのコメント
 筆者の言われる「NHKコロナサイト」での移動平均≠ヘ後方移動平均≠ニいうようです。また、筆者がここで定義された区間平均≠ヘ、中央平均(または中心化移動平均)というようです。
 すると当然に、前方移動平均≠ニいうものもあります。これは、未来(例えば3日先)の傾向を簡便に予測するといった使い方もできるようです(ただし、この予測ができるのは同じ傾向が続いている間のみで、長く続いた上昇が下降に転じたり、またはその逆の時にそれらの変化点は予測できないとは思いますが)。
Posted by かわっこだっこ at 2021年10月08日 00:52
グラフの形が右向きにずれているということは、変化が遅れることを意味しますので、「先行」と表現するのはまずいのではないでしょうか。
Posted by はぎわら_m at 2021年10月08日 01:36
> 後方移動平均

 なるほど。ググると、そういう言葉も見つかりますね。
 私は Wikipedia を見ただけですが、そこでは「後方移動平均」という語はなかったので、その語は知りませんでした。


> 「先行」と表現するのはまずいのではないでしょうか。

 「遅れているか」「先行しているか」は、何を基準としているかで交替してしまうので、わかりにくい概念ですね。表現には私も迷いました。
 ここでは特に「ズレ」があることだけに着目してください。「遅れているか」「先行しているか」という表現には、あまりこだわらないでいいでしょう。数字とグラフで理解するだけでいい。
Posted by 管理人 at 2021年10月08日 06:53
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ