・『老子』諸本 NGSM データ

凡例

  1. この表は『老子』諸本の語句の使用頻度を対照表化したものである。
  2. 採取した NGSM のデータは 1gram ~ 6gram の間のもので、1gram は頻度 1 以上、2gram ~ 6gram は頻度 2 以上の例を抽出している。
  3. NGSM の手法によって得られたデータを、Microsoft Excel 2000 の[分散分析(繰り返しのない二元配置)]によって分散値(※諸本間で検出頻度の異同がないと値は "0" になる。値が大きいほど異動幅が大きい。)を算出し、その値の上位100語の結果を Webページ化した。
  4. 表中の略号はそれぞれ、[甲]= 馬王堆帛書甲本、[乙]= 馬王堆帛書乙本、[王]= 江戸明和王弼本(宇佐美本)、[景]= 景龍易州龍興観碑、[敦]= 敦煌唐鈔本( S6453 + P2589 )、[道]= 正統道藏河上公章句本、[武]= 武内義雄校定本(拠本邦伝存古鈔本)、[四]= 文淵閣四庫全書本、[玄]= 正統道藏開元玄宗御注本、[傅]= 正統道藏道徳經古本篇 を示している。これらの諸本に関する詳細は、拙稿「『老子』傅奕本来源考」(『漢字文献情報処理研究』4、2003)を参照されたい。
  5. Web 上に掲載する都合上、IBM拡張字体を避けるなど NGSM データに幾つかの改変処理を加えている。ところにより拙稿「『老子』傅奕本来源考」と字体表記を異にするものがあるが ご寛恕あれたい。
  6. 本表により、n-gram 解析結果から有意なデータを抽出するのに、分散分析(繰り返しのない二元配置)が有効であることにお気づきいただければ充分である。但し、この手法は同一文献の異本比較に限って利用すべきものであり、内容や分量の全く異なる複数の文献の比較を行う場合は、語句の検出頻度を千分率化して比較するなど別の手法が要求される。
  7. 参考資料としてクラスター分析(似たもの同士をクルーピングするための分析)の結果も掲載しておく。
  8. より詳細なデータをご希望の方は、秋山 ( akiyama@karitsu.org ) までご相談下さい。

補足:表中の四庫全書本で14例見える「・」(分散値14.40)は「玄」の欠筆字体である。

諸本『老子』1~6gram 上位100 NGSM サンプル

 分散
174178181014281111624738.90
0000102010003501779.12
90909910011010101641071694.23
192189244242237245246246248243515.73
484910000001414.10
004741405449504449406.27
270269252224228259262255249283333.88
13615011910092118120119112128274.49
394120012201271.29
969095736797999689116187.73
0027102829261827183.38
323200000000182.04
302900000000154.77
2525112110229112794.01
88302930303030293185.39
14915514412813314414514114715778.90
而弗20200000000071.11
2600000000466.89
00001408102260.28
21202122721132021056.71
529282828282828282453.16
而不2123372725383837353950.67
16516416315615516616915816117846.06
15170000000045.73
25231010897109742.84
3335311429343132303841.34
81838710383899089848938.62
24161518171916172038.49
呵其14150000000037.43
兮其00110011131061334.04
2041110211829.11
9910111210610311011311111211227.21
161715171718191718127.17
1110900916831126.68
0000001600025.60
也故12120000000525.43
1212111011126111424.22
也以11120000000222.94
无爲00001101104021.16
無爲99111201201181120.90
無以4491009010101219.51
无以00001001000017.78
888008008716.46
12121261131313121316.01
也是7110000200515.17
14149915978914.72
0009101111014.68
000800880114.50
者不1820252117262726262614.40
0000000120014.40
8810109910101014.28
夫惟0000000201214.27
人之2627201617202019162014.10
111112121212120121214.04
呵其若980000000012.90
也¶880003300712.32
0000000001112.10
其無998708074812.00
也是以790000200511.79
0000106033011.73
夫唯9101110101112911011.57
其无000080804011.56
111010111011111010011.16
也以其880000000211.07
13178761011910710.84
6767596163616059606610.46
2929343534323232314010.40
也不780000400410.23
3237302628292727293010.06
于無780000000010.06
无所00008070209.79
343432292835333232399.51
而民710702877599.51
其若99400453349.43
之於00843867239.21
兮若00600657029.16
707670686669696972748.68
矣¶66500262498.67
454448485044424344508.62
聖人之88200222258.54
之相66000460568.46
454642383944434441388.44
44510797778.32
下之14126789988148.06
1413129715131410168.01
無所77670706577.96
99890777997.60
393435322834333433327.60
以知11104566735107.57
也夫58000020027.57
之不151617121217181817217.57
666563656066696463697.56
292623232324231923277.56
可以12131077121198157.16
66000515557.12
787882817583828283816.94
修之55000505556.67
以聖人之66000000006.40
是以聖人之66000000006.40
恆無66000000006.40