凶悪犯罪の新聞報道はあまり増えていないかもしれない

「少年犯罪報道」の急増について (荻上式BLOG) に、少年犯罪は実際には増えていないにも関わらず少年犯罪報道は急増しているため市民の不安があおられているという話に関連して、報道の量に関する統計がいくつか紹介されていた。

その一つに浜井浩一氏が調査した統計がある。これは朝日新聞の記事データベース(朝日DNA, 現在の聞蔵)から「凶悪 AND 殺人」で検索してヒットする記事数をグラフにしたもの。ソースは以下の論文(全文PDFあり)。

この統計に対して id:gerlingさんが疑義を表明した。

 聞蔵を見たわけじゃないからはっきり言えないないんだけど、けっこうな割合でグラフの数字が怪しいんだけど。これ、id:sjs7くんが気づいた件と一緒じゃない?んー、いちいち雑誌のバックナンバーやら、新聞の縮小版見たとは思えないしねえ。無理でしょ、それじゃ調べるの。

http://d.hatena.ne.jp/sjs7/20070625/1182776443

2008-02-01 (オオツカダッシュ)

そして、同じDBを使って色々調べているのだが。。。

うーん、肝心の「凶悪 AND 殺人」の追試をなぜやりませんか?

とはいえ手を動かしていることに敬意を表して僕も調べてみることにした。

何が問題か

浜井氏の統計の何が疑われているかというと、以下の二点。

  1. 記事数で比較することに意味があるか
  2. 朝日DNAの記事データベースは偏りがあるのではないか

1 については年間の全記事数が増減しているなら「凶悪 AND 殺人」を含む記事が増えていても意味がないのではないかということ。「id:sjs7くんが気づいた件と一緒じゃない?」ということなので gerling さんはこれも問題視していると思われるが、僕は必ずしも問題だとは思わない。

sjs7 さんはある世論の高まり(心理学の流行)の存在を「世論がメディアに」与えた影響の痕跡から裏付けようとしているのに対して、浜井氏は「メディアが世論に」与えた影響(治安の悪化という認識の広がり)を、メディアが発信する情報量の変化で裏付けようとしている。前者の場合は全記事数が増加していると記事の増加が世論の高まりの結果かどうかわからなくなる。しかし後者の場合はとにかく増加していれば情報量は増えているのはわかる。

「凶悪 AND 殺人」を含む記事の絶対数が増えるということは、単純に考えればそのような記事が目に付く機会が増えて影響力が高まるということだ。これは広告をたくさん出せば物が売れるというのと同程度の単純な考えではあるが、大雑把に傾向を見る分には妥当であろう。

2 については問題だ。浜井氏の統計は1985年から2004年までの記事数の推移を見ているのだが、朝日DNAのデータベースにはこの間の全ての記事が収録されているわけではない。具体的には、1985年から収録されているのは東京本社版ニュース面のみで、ニュース面以外の記事や地方版の記事などはより最近の記事しか収録されていない。

このように、古い年度については一部の記事しか収録されていないため検索ヒット数が実際より減ってしまう可能性がある。

浜井論文にはキーワードと年度以外の絞り込み項目や値の補正については明確に書かれていない(注釈に「ランダム誤差とはいえない特別の偏りの発生についてチェックを行った」とだけある)。まさかとは思うが、sjs7 さんと同様に単純にキーワードと年度だけで検索したヒット数を集計しているのであればほとんどでたらめな結果になっている可能性がある。

検証

手近に聞蔵にアクセスする方法がないので、同じDBを使っていると思われる G-Search で調べてみた。G-Search 朝日新聞記事情報を見ると収録開始日などは聞蔵と同じである。

まず「単純にキーワードと年度だけで検索したヒット数を集計」して、浜井論文のグラフと同じものができるかどうか試してみた。*1

結果は、全くと言っていいほど同じグラフができてしまった(2007年まで集計したので右端は違う)。

朝日新聞記事DBから「凶悪 AND 殺人」を単純に検索した結果を集計したグラフ

浜井論文のグラフ

それでは収録記事数の偏りはどの程度グラフに影響しているだろう? 収録記事の偏り方が複雑で正確なことはわからないが、思いっきり単純化してその年の全記事数をしめる割合を見てみよう。これは浜井論文が見ようとした「メディアの影響力」の指標ではないが、メディアの関心の度合いの指標として(ごく大雑把にではあるが)解釈できると思う。

G-Search では、ある年の全記事数というデータはそのままでは得られないようなので、「凶悪 AND 殺人」にヒットしない記事の数、すなわち「NOT (凶悪 AND 殺人)」にヒットした記事の数を調べて、これに「凶悪 AND 殺人」にヒットした記事の数を足してその年の全記事数とした。

計算するとだいたい 0.03% から 0.06% の間になり、その推移をグラフにすると以下のようになった。

朝日新聞記事DBから「凶悪 AND 殺人」が含まれる記事の割合を集計したグラフ

増加傾向は見られるものの浜井論文の統計に比べると地味な結果である。*2

繰り返すが、上のグラフも含め、単純に検索してヒットした記事数を元にいくら計算しても、特に古い年代は収録記事の偏りが大きいのでデータとしてはかなり無理がある。1985年から収録されている東京本社版のニュース記事に絞り込んで検索すれば偏りはなくなると思われる。G-Search にはそのような絞り込み項目はないので僕はそこまで調べていない。聞蔵を使える人は試してみて欲しい。

また、浜井論文には同じ方法を使ったと思われる別のキーワードによる統計もあるが、これらも検証が必要だろう。

参考

上の集計で使った Excel ファイルを置いておく。データは手入力でチェックもほとんどしていないので、正確さは保証しない。


*1:G-Search は検索してヒット件数を出すところまでは無料。

*2:見ているものが違うので値は比較できない。これは単に派手さの比較。