土壌汚染とコメのセシウム濃度は無関係? マキノさんによるグラフの検証

98
Jun Makino @jun_makino

明らかに相関があるプロットをもってきて「無関係」というのはいくらなんでも勘弁してほしい。

2013-08-25 21:41:06
Jun Makino @jun_makino

https://t.co/8fqGiWZsKS このグラフ 、相関あると思うけどないといやなので数える。

2013-08-25 22:23:53
Jun Makino @jun_makino

土壌 5000 以上、玄米 20 以上は 14 または 15 点ある。安全側の 15 をとる。 そうすると、 20 以上は 24% だったとのことなので、土壌 5000 以上のトータルの点数は 63 程度である。

2013-08-25 22:23:55
Jun Makino @jun_makino

プロットしてある総点数は 432 とあるので、土壌 5000 以下のは 369 点となる。

2013-08-25 22:23:57
Jun Makino @jun_makino

さて、土壌 5000 以下、玄米 20 以上は点々の数を数えると 26 くらいに見える。

2013-08-25 22:23:59
Jun Makino @jun_makino

従って、土壌 5000 以下の 369 点のうち 343 点、つまり 93% くらいは玄米 20 以下である。 この割合は土壌 5000 以上の 76% の 1/4-1/3 であり、ずっと少ない。

2013-08-25 22:24:01
Jun Makino @jun_makino

言い換えると、土壌 5000 以下では玄米が 20 を超えるのは 7% 程度だが、 土壌 5000 を超えると 24% と 3 倍以上になる、ということである。従って平均値も 3 ー 4 倍違う可能性が高い。

2013-08-25 22:24:03
Jun Makino @jun_makino

なので、このグラフの、玄米 20 より上のところで実は非常に多数のデータがぴったり重なった位置にあって、データ数が数えた点数よりずっと多いのでなければ、このグラフからは土壌中の濃度と玄米中の濃度には相関がある、といえる。

2013-08-25 22:24:04
Jun Makino @jun_makino

グラフの件、いいなさんと早川さんに賛成されている。ふみ。

2013-08-26 21:43:26
Jun Makino @jun_makino

あ、、、失礼しました。早川さんのほうが先ですね。なお、両対数グラフについては https://t.co/I04LWIYK7B のほうが.. http://t.co/OmwZISpMBo

2013-08-26 22:05:19

例題

Jun Makino @jun_makino

このグラフをみて相関がないと思うひとはまあいないと思いたい。 http://t.co/64W1hpqPz5

2013-08-26 13:14:13
拡大
Jun Makino @jun_makino

もちろん、同じデータである。

2013-08-26 13:15:09
Jun Makino @jun_makino

そ、そうかー、、、(自粛)

2013-08-26 13:34:50
彫木🌗環🧷✂️✏️(オミクロン株にはガッカリだよ) @CordwainersCat

「重要なことはいかにしてxとyを線形関係にするかです。本事例のポイントは、横軸(x)縦軸(y)の値ともに自然対数を取り 〜 かなりまっすぐな直線にすることに成功したことです。強い線形関係を見つければ、あとは素直に伸ばす(外挿といっています)だけで精度よい予測が可能になるのです。」

2013-08-26 15:08:59
彫木🌗環🧷✂️✏️(オミクロン株にはガッカリだよ) @CordwainersCat

@CordwainersCat あ、X軸、Y軸ともに対数を取ってしまうと二次関数だろうが三次関数だろうが線形に見えちゃうのか。実際の相関の次数(ベキ)を判定するにはどうすれば良いんだ? 分からなくなってしまった。

2013-08-26 15:29:13
Jun Makino @jun_makino

@CordwainersCat あ、これは大変重要なポイントで、両対数グラフでの直線の傾きがべき指数になります。式だと y=Cx^α が Y=αX+logC (Y=log y, X=log x として) となるので。もとが線形なら傾きは必ず1。

2013-08-26 17:33:51
Kazuharu Aihara @skycancer

@jun_makino グラフに使用されたデータは先生がご用意されたデータでプロットされた,という事でしょうか? どの様なデータを使われたのか差し支えが無ければご教示頂ければ幸いです.

2013-08-26 22:58:41
Jun Makino @jun_makino

@skycancer x が(私のプログラムが間違ってなければ)確率密度が P∝ x^-1.2 のべき分布(定義域が [100,10000])、y方向は平均値が x に比例する指数分布 (P∝ exp(y/x))です。

2013-08-26 23:05:26
Jun Makino @jun_makino

うーん、私の書いたグラフのデータが元の土壌と玄米のデータだと思った人が複数いたのか、、、軸も値も違うのに、、、このへん私の説明不足ではある。

2013-08-26 23:14:34