国立国語研究所プロジェクト選書1
新聞電子メディアの漢字
-朝日新聞CD-ROMによる漢字頻度表-

写真

横山詔一、笹原宏之、野崎浩成、エリク・ロング 編

3,800円 A5 304頁 978-4-385-35837-X 品切

朝日新聞1年間の記事を収録したCD‐ROMのデータを分析。紙面とCD‐ROMデータを綿密に照合し、JIS外漢字も含め全漢字の紙面とCD‐ROMにおける頻度・順位を明示。異体字の出現頻度も示す。最新版漢字頻度資料。

1998年 7月10日 発行

 国立国語研究所プロジェクト選書2 現代日本の異体字
 国字の位相と展開



●まえがき

 新聞という「ことばの海」には、いったい何種類の「漢字」が、どのくらい生息しているのであろうか。今回『朝日新聞』という水域に観測の網を投げ、漢字の捕獲作戦を4年間にわたって展開した。その結果、4,000種類を超える漢字が採集され、それらの挙動の一部を明らかにすることができた。

 本書の特徴は、新旧2種類の網を組み合わせて使った点にある。1つは旧来型の紙メディアによるもので、もう1つは電子メディアを活用した新しい方式である。紙メディア方式は、網にかかった漢字の実物を専門家が目で確認しながら、それらの種類や頻度を記述・分析していかねばならないので、膨大な手間と時間がかかる。一方、電子メディア方式は、捕獲したすべての漢字の種類、頻度、属性などを、コンピュータが一瞬のうちにはじき出してくれるので、大量のデータをさばくことができる。

 では、電子メディア方式は紙メディア方式よりも格段に優れていると断言できるのであろうか。本書の狙いの一つは、『朝日新聞CD-ROM』という電子の網が、実際に紙面に登場した漢字を、果たしてどの程度まで確実にキャッチしてくれるのかを具体的に評価し、可能な限り綿密に記録することにある。あらかじめ結論の一部を述べると、現時点での電子の網には、ところどころボッカリと穴のあいた箇所があり、JIS漢字の範囲といえども全部を捕捉できる訳ではない。新聞紙面における漢字の実物と、それを模写したはずのバーチャルな電子メディア空間における漢字とでは、さまざまな違いが見られる。「ことばの海」を「ことばの大空」と言いかえるならば、紙面上の漢字と朝日新聞CD-ROMの関係は、航空機と航空管制レーダーのそれに似ている。レーダーは、人間の視力をはるかに超えた広い範囲を素早く探索する。しかし、レーダー画面に映し出される機影だけに頼って、それがどの航空会社の旅客機なのかを判断したりすることは危険きわまりない行為である。システムに死角がないとも限らない。本書では、この点を踏まえて、紙メディア方式を併用した。

 漢字頻度表の作成にあたって、朝日新聞CD-ROMの内容を子細にチェックした。それが、あたかも「あら探し」をしているかのような印象を与えるかもしれないが、そのような後ろ向きの意図はまったくないことをご理解願いたい。同じように、JIS漢字の間題についても、具体例を示して詳細に取り上げたが、批判的視点から意見を述べたつもりでは決してない。本書はあくまでも中立的な立場で、学術研究として事実を究明したまでである。

 新聞を対象にした本格的な漢字調査は、1966年(昭和41年)に図立国語研究所によって初めて実施された。それから約30年を経て、本書が世に出る運びとなった。このような「漢字の生態調査」が、いわば定点観測のような形で21世紀になっても継続して展開されることを心から祈っている。本書がその布石となり、新聞以外のジヤンルも包含したより広い見地に立つ「文字観測網」がいつの日にか実現するならば、それに勝る幸せはない。

 朝日新聞CD-ROM(CD-HIASK′93テキストデータ)の著作権使用許諾については、朝日新聞社電子電波メディア局著作権チームマネージヤーの杉野信雄氏と国立国語研究所情報資料研究部長の江川清氏にお世話になった。紙面(朝日新聞縮刷版)とCD-HIASK′93の綿密な照合作業は、佐藤朋子氏と藤川美穂氏を中心にして平井美恵子氏と齋藤華乃氏の計4名に、83JI8漢字符号についてのチェックは太田幸代氏に、データの整理と本書に関するWebページ作成は谷口智美氏に、それぞれお手伝いいただいた。さらに、朝日新聞社用語幹事室の比留間直和氏と三省堂の高野郁子氏・奥川健太郎氏には原稿作成にあたり貴重な示唆をいただいた。これらの方々に厚く感謝申し上げる。

 なお、漢字頻度表データの作成は、以下の文部省科学研究費補助金の援助を受けた。「国際社会における日本語についての総合的研究」(創成的基礎研究、代表者:水谷修、分担者:横山詔一)、「インターネットにおける学術漢字の符号化に関する基礎的研究」(重点領域研究、代表者:斎藤秀祀、分担者:横山詔一)、「海外日本語学習リソース提供システムの実験研究」(図際学術研究、代表者:柳澤好昭、分担者:横山詔一)、「ネットワーク環境における日本語学習支援システムの開発とその遠隔地利用への応用」(契励研究A、研究代表者:野崎浩成)、「日本全国における小地名使用漢字に関する調査研究」(奨励研究A、研究代表者:笹原宏之)

1998年7月

編著者一同



●目  次

「国立国語研究所プロジェクト選書」刊行にあたって
まえがき
目次
第1章 調査の概要  1
第2章 漢字頻度表  29
    1.区点番号順の漢字頻度表  29
    2.頻度順の漢字頻度表  219
    3.異体字関係にある漢字の一覧表  262
第3章 「幽霊文字」と「辞書非掲載字」の出現状況  273
第4章 今昔文字鏡フォントの利用方法  289
索引  293<



●見本ページ

見本ページ

このページのトップへ

トップページへのアイコン




Copyright (C) 2014 by SANSEIDO Co., Ltd. Tokyo Japan