大蔵経データベース

「大正大蔵経」データベース化…7月完成、9月無料公開
http://www.yomiuri.co.jp/net/news/20070508nt0d.htm?from=os1
ついにやりました。
かつて、平川彰先生だったかの追悼文で、「この語句はこの経典にあるというのを言うのは易しいが、先生はこの経典にないといえる先生だった」というような話があったが、今は検索で引っかからなければないということがすぐ分かるようになった。仏教学も新たな進展を見せるだろう。
その一方で、語句の意味をひとつひとつ吟味するという作業が疎かになるのではないかという心配もある。仏典は文字面だけではない。「研究する書物をパソコンに入力して、それで研究したつもりになっていたら大間違いだ」という高橋孝信先生の言葉を思い出した。
とはいえ、私もほんの少しの間だがアルバイトで入力作業をやっていたので、このプロジェクトの完成は素直に嬉しい。あまりに性能の悪いOCRにがっくりし、JIS規格にない難字が出てくると頭を抱えたものだ。
いつも法要でパラパラめくっている『大般若経』。いったい「無」と「空」はいくつ出てくるかとか、調べてみたい。


で、調べてみました。これを統計的に分析して思想の傾向を抽出したりできないものだろうか。
大般若経600巻の文字数は、4,820,693字。
否定語の頻度
1.「無」181,302字(3.8%)
2.「不」114,329(2.4%)
3.「空」69,440(1.4%)
4.「非」30,063(0.6%)
1万回以上の頻出熟語
1.「清浄」85,549
2.「一切」59,355
3.「菩薩」48,679
4.「波羅蜜多」46,022
5.「摩訶薩」37,352
6.「般若」34,064
7.「可得」21,890
8.「自性」15,508
9.「菩提」14,535
10.「世尊」14,391
11.「解脱」11,960
12.「方便」11,502
13.「有情」11,264
14.「眞如」11,221

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


The reCAPTCHA verification period has expired. Please reload the page.