「堀」「掘」問題の教訓

「堀」「掘」問題についての essa さんの自己検証記事が出た。

どうも違和感が拭いきれないのだが、うまく説明できない。とりあえず思っている事を書く。

テクニカルな教訓: 誤差に注意。

20日の記事で、essa さんの見た解析データが紹介があり、最後に「どのへんに問題があったかについては、もう少し考えてから別途書きます」とあったので、僕はてっきりデータの見方の問題を扱うのかと思ったが、今回の記事ではその点には触れていなかった。その意味での「どのへんに問題があったか」を簡単に指摘したい。

一言でいうと、誤差のレベルを見極めずにデータを比較したところに問題があったと思う。こういう画像の比較に限らず、誤差の問題はデータを見る際に一般的に重要な点。

誤差の性質は異なるが、視聴率とか内閣支持率とかが何%上がったとか下がったとか、他と比べてどうだとかいう話をする時も誤差の事を考える必要がある。このあたりは keyword:世論調査にも少し書いた。

 あくまで標本調査なのでどんなに厳密に実施されたとしても確率的な誤差が残る。場合によっては数%程度の誤差はあるので、報道等で見られる「初めて○○%を割り込んだ(または越えた)」「前回より×.×ポイント低下(または上昇)」のような表現には注意を要する。

データ的な検証結果は「動かぬ証拠」的な印象を与えがちなだけに注意したい。検証コストとのトレードオフという話もあったが、こういうちょっとした知識が身についていれば、証拠としてのスジの良さを判断する程度の事にさしてコストはかからない。僕のやったような画像を使っての検証は本来必要ない。ああいうコストは間違いが広く流通してしまったがために必要になった手戻りコストだ。

2ちゃんねる集合知

essa さんの検証記事は「プロセスには問題がない」として2ちゃんねる情報の扱いはこれからも変えないと宣言している。なぜそうなのかという説明については感覚的にはひっかかる部分が多々あるのだが、結局は2ちゃんねる集合知に対する信頼性というところにいきつくと思う。匿名性や流動性の違いはあるが、essa さんは2ちゃんねる集合知生成装置の性能を信頼し、自分のブログもその一要素と位置付けているのだろう。このあたり僕とはスタンスが違う。

しかし、その性能を信頼するとしても「2ちゃんねらの調査力によって一日で偽造確定です」というのは誇大表現には違いないと思う。essa さんの考える2ちゃんねる集合知の性質は一日で正解にたどり着くほどスマートなものではないはずだ。僕は2ちゃんねるの解の収束性*1自体に懐疑的だが、収束するとしても速やかに、真っ直ぐに正解に近づくことは少ないのではないか。

経験的に言ってだいたい「祭り」の初期には多様なネタがあまり検証されていないうちにまとめられて一定の結論に導くようにテンプレ化される。イラク人質事件でも自作自演説のテンプレ(10項目くらいの「根拠」をリストアップしたもの)が一日で出てきた。

2ch には多様な意見があると言っても色んな意見がまんべんなく出てくるわけではない。特に情報が少ない祭りの初期には些細な情報が過剰に意味付けされがちで、出てくる意見には偏見が混じりやすいし、この時期の客層は「はしゃぎすぎ」属性が強くて慎重さや冷静さは期待しにくい。

テンプレ化されコピペが出回る頃には意見のバランスは(一時的にではあるが)一気に傾く。往々にして正解にたどり着くまでは大きな揺れがあるし、揺り戻しの力は 2ch の自浄作用というよりは 2ch の外から供給される事が多いのではないか。

その他諸々

まとまらないので断片的にメモ。

  • 嘘も(集中的に)100回繰り返せば(一時的には)真実になる。速報性の追求は嘘のカウントアップに貢献してしまっていないか。
  • 2ch の仕組みではデマのバブルとその崩壊、みたいな激しい揺れ幅に振り回されて余計なコストがかかってしまわないか? コピペ兵の尻拭いみたいなコストは必要なコストなの?
  • 時間や手間というコストと近似解の精度のトレードオフはある。言い換えるとコストをかけないと正解にはたどり着けない。そのコストを誰が負担するのか。うまく分担できるのか。
  • 情報の流れの中で責任が先送りされてぐるぐる回っていって、結局誰も他人に対して責任を持たない(自分の行為が自分に返ってきた分は自己責任だが)のではないか。そんな状況で集団知は正解に収束するのか? 少なくとも責任感を持った人が一定数いないとだめなのでは?
  • 多様性が失われないように、というが、2ch の中で発生した多様性から一部を切り取って追認するのは多様性に貢献するのか。むしろ多様性を縮減しているのでは。それなら無理に書かないほうがマシなのでは。
  • 工作員」の「意図的な扇動」なんかより薄く広く共有された偏見のほうがよっぽど怖い。そんな時、集団知ナチュラルに間違った解に収束し、権威付けされ、偏見を再生産することにならないか。

なんか書いてるうちに『ウェブ進化論』の悲観的な読書メモを思い出した。


*1:暫定的な近似解から徐々に正解に近付いていく性質。