【辞書学メーリングリストログ】 →ログメニューへ

1998年12月 (21日〜31日)


From: Asahi-net email <>
To: "lex List Member" <>
Subject: [lex] PC表現 {02}
Date: Mon, 21 Dec 1998 13:15:31 +0900

TO:辞書学ML

           FROM: 大修館書店 飯塚利昭

===========================

 我田引水で恐縮ですが,前にこの部屋で話題になった

  南出康世 著『英語の辞書と辞書学』(大修館書店)
   ISBN4-469-24431-7    \2500

では,辞書との関わりという観点から,PC表現について書かれた章
があります。

> 再び、谷@武庫女です。
>
> 学生の一人がPC表現に興味を持っているのですが、
> 良い参考書や論文などありましたらご教示願います。
>

===========================
IIZUKA Toshiaki 飯塚利昭 大修館書店 編集第二部



From: TERAMOTO Mamoru <>
To: "lex List Member" <>
Subject: [lex] PC表現 {02}
Date: Mon, 21 Dec 1998 15:29:39 +0900

寺本@三省堂です。

"Akinobu TANI" <> さんは書
きました:
>学生の一人がPC表現に興味を持っているのですが、
>良い参考書や論文などありましたらご教示願います。

手元にあるもので、面白いものを紹介します。参考になるかどうか
はわかりませんが。

Beard, Henry and Christopher Cerf,
"THE OFFICIAL POLITICALLY CORRECT DICTIONARY and
HANDBOOK",updated edition,
1994,Villard Books (a division of RANDOM HOUSE, Inc.),$10.00
ISBN 0-679-74944-6

200ページたらずの小さな本ですが、写真や挿し絵が豊富で、
source notes(36ページ) が充実しています。
章建ては以下。

prt.T A DICTIONARY OF POLITICALLY CORRECT (PC) TERMS AND
PHRASES −From ableism to Zeus-as-rapist
prt.U POLITICALLY INCORRECT / POLITICALLY CORRECT
DICTIONARY −From abominable snowman tozoo guide
prt.V OTHER SUSPECT WORDS, CONCEPTS, AND "HEROES" TO BE
AVOIDED AND/OR DISCARDED
prt.W KNOW YOUR OPPRESSOR −A Bilingual Glossary of
Bureaucratically Suitable (BS) Language

なお、『アメリカ英語差別・反差別表現辞典』(1995、秀文インタ
ーナショナル、1680円、ISBN 4-87963-483-2)として市販されてい
ます(Benjamin Cole氏解説/高島禎子翻訳の小冊子付き)。

○◆○ ●◇● ○◆○ ●◇● ○◆○
TERAMOTO Mamoru(寺本衛)三省堂 外辞部
tel:03-3230-9457/fax:03-3230-9547
email:



From: kazuo kato <>
To: "lex List Member" <>
Subject: [lex] 「歯磨き粉」余聞 {01}
Date: Tue, 22 Dec 1998 09:43:45 +0900

加藤@岩手医大です.

昨夜たまたま NHK の衛星放送で見た Danny Kaye 主演の "The Five Pennies"
(1959) というミュージカルの中に,Kaye の新婚の妻役の Barbara Bel
Geddes が Kaye に "Here's your toothpaste." とかと言いながら「練り歯磨
き」を手渡す場面がありました.そこが日本語字幕では「歯磨き粉」になって
いました.
どうも,toothpaste の意味の「歯磨き粉」はかなり古くから使われていたよ
うですね.と言うより,最初から両方の形が用いられていた,というのが正し
いのかもしれません.

加藤 和男



From: (SATO Hiroaki)
To: "lex List Member" <>
Subject: [lex] 「歯磨き粉」余聞 {02}
Date: Tue, 22 Dec 1998 11:16:40 +0900

At 9:43 AM 98.12.22 +0900, kazuo kato wrote:
>加藤@岩手医大です.
>
>昨夜たまたま NHK の衛星放送で見た Danny Kaye 主演の "The Five Pennies"
>(1959) というミュージカルの中に,Kaye の新婚の妻役の Barbara Bel
>Geddes が Kaye に "Here's your toothpaste." とかと言いながら「練り歯磨
>き」を手渡す場面がありました.そこが日本語字幕では「歯磨き粉」になって
>いました.
> どうも,toothpaste の意味の「歯磨き粉」はかなり古くから使われていたよ
>うですね.と言うより,最初から両方の形が用いられていた,というのが正し
>いのかもしれません.
日本語の字幕は,1959年以降に作られている可能性もあるので,注意が必要でしょう。
あと,日本語字幕翻訳家が数人しかいないので,その人たちの<方言>が字幕に出て
しまう場合もあると思います。それと,日本語字幕は,なるべく文字数を減らす,と
いう原則があるので,1文字少ない「歯磨き」が好まれたのかもしれません。

手持ちの映画で調べると,古い映画でも「歯磨き」という字幕でした。(この場合も,
日本語字幕はもう少し後の年代に作られていると思います。)

#1/1 1931年 01-B LD 00:07:18
■The Champ// チャンプ
[06:53]
#There's your toothbrush and >>TOOTHPASTE<<.
歯ブラシと歯磨きよ
#1/1 1933年 04-A LD 00:06:30
■A Lady for A Day// 一日だけの淑女
[06:24]
#Do you know it's got so bad I got to go and buy me own >>TOOTHPASTE<<?
歯みがきでさえ自分で買う

#1/1 1941年 C26-B LD 00:25:21
■Citizen Kane// 市民ケーン
#[25:14] And, uh, have them wrap them up to look like, uh, >>TOOTHPASTE<<
or somethin'...
or they'll stop them at the desk.
分からないように包んで...(字幕ではtoothpasteが訳されていない)

#1/1 1957年 K03-A LD 00:34:29
■King in New York, a// ニューヨークの王様
#[34:23] Yes, but how can you suddenly branch off into >>TOOTHPASTE<<?
だがどうして急に歯磨きになった

〜〜〜〜〜〜〜

「新潮文庫の100冊」とういcdromがありますが,このデータをテキストに変換するソ
フトが昔,NiftyServeで公開されていました。これをコーパスに使えば,どの時代か
ら「歯磨き」になったのかのヒントが見つかるかもしれません。
___________________
(SATO Hiroaki)
http://www.senshu-u.ac.jp/~thc0408/
〒214-8580 専修大学8号館8411研究室
佐藤弘明 専修大学・商学部・助教授(英語)



From: Kinsaku <>
To: "lex List Member" <>
Subject: [lex] 「歯磨き粉」余聞 {03}
Date: Tue, 22 Dec 1998 11:29:27 +0900

SATO Hiroaki さんは書きました:

>日本語の字幕は,1959年以降に作られている可能性もあるので,注意が必要でしょう。
>あと,日本語字幕翻訳家が数人しかいないので,その人たちの<方言>が字幕に出て
>しまう場合もあると思います。それと,日本語字幕は,なるべく文字数を減らす,と
>いう原則があるので,1文字少ない「歯磨き」が好まれたのかもしれません。

おっしゃるような事情から「歯磨き」が使われているのかもしれません。
ただ、いつまでか記憶がはっきりしませんが、少なくともダニー・ケー
のこの映画が上映された頃は、歯磨き粉が一般であったと思います。
文字通り、粉が丸い平たい缶に入っていて、歯ブラシでその粉をすくい
とる、あるいは歯ブラシにつけて、歯を磨きました。練り歯磨きが
いつごろ歯磨き粉を市場から駆逐したのか、その筋の会社にきけば
分かるかも知れません。

そのころの癖が残っているのかも知れませんが、私はいまだに「歯磨き粉」
をチューブから練りだして使います(^_^)。

たかす@みやざき



From: k itaya <>
To: "lex List Member" <>
Subject: [lex] 「歯磨き粉」余聞 {03}
Date: Tue, 22 Dec 1998 12:26:18 +0900

最近加入させていただいた板谷ともうします。
議論の経緯が判らず頓珍漢かと思いますが、以下何か参考になれば。

「歯磨」で祖父が使っていた「スモカ歯磨」を思い出しました。
サントリーの元々の会社、寿屋が経営した会社という事を聞いた事があり104で
大阪の会社を検索してもらいました。
現在、大阪市西淀川区に会社があり電話に出られた方に以下尋ねました。

・1924年創業という事ですが「歯磨」の草分けでしょうか
『当社より先に資生堂さんあたりが製造しておられますので先駆者でありません。
 当社製品の特徴は潤性という事で湿り気があるのです。それまでの歯磨粉は
 吹き散りました。ここに当社製品の差別化ポイントがありました。』

・今でもサントリーの関係会社で
『昭和7年に独立しました。』

・練り歯磨きはいつからありますか
『明治中期に資生堂が商品化している筈』

祖父がスモカ歯磨を使っていましたが、龍角散のように飛び散る歯磨粉はお目に
かかった事がありません。

資生堂の歴史を調べれば、もうすこし日本に於ける粉と練製品の歴史が判るかも。

板谷邦雄



From: yasuko Okabe <>
To: "lex List Member" <>
Subject: [lex] 新潮 {01}100冊・テキスト読み出しツール
Date: Tue, 22 Dec 1998 14:35:51 +0900

奈良女子大学の岡部(国語学)でございます。
しばらく無音をいたしました。

先日は Applese、Microsofteseの実例についてのご教示、ありがとう
ございました(お礼が大変遅くなり、申し訳ありません)。
ディレクトリをフォルダと呼ぶことも、そういえば Microsofteseだ
ったのですね!すっかり毒されているのを自覚した次第です…

ところで

> 「新潮文庫の100冊」とういcdromがありますが,このデータをテキストに変換するソ
> フトが昔,NiftyServeで公開されていました。これをコーパスに使えば,どの時代か
> ら「歯磨き」になったのかのヒントが見つかるかもしれません。

CD-ROMの本文部分をテキストファイルに変換するコンバータプログラム
(正式名称「新潮文庫の100冊・テキスト読み出しツール EXB2T」)は、
現在も公開されております。
ベクターのこのページ↓あたりが、使い勝手もよいかと思います。
http://www.vector.co.jp/vpack/browse/software/dos/util/sn052010.html

このツールを使ってコンバータした本文に さきほど検索をかけてみた
ところ、5例ほどひっかかってまいりました。
少し長くなりそうなので、用例のほうは別便にてご報告いたします。

余談ながら、上記のツール、変換作業にDOS窓からコマンドを打ち込んで
ひとつひとつコンバータしてゆくのは、かなりの時間と労力を食います
(なにしろ作品数だけでも100冊、大部なものは一作品あたり数個か
ら数十個のファイルに分けて収められていますので、全部で400回余
りも、同じ操作を繰り返さなければなりません)。
わたくしはコマンドをバッチファイルを組んで走らせたので、PCに貼
り付いていなくてすんだのですが、それでも、要領が悪いのか全てのファ
イルをコンバートする作業で、半日ずつ2日間も費えてしまいました(泣)。

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: yasuko Okabe <>
To: "lex List Member" <>
Subject: [lex] {01}新潮100冊ツール
Date: Tue, 22 Dec 1998 14:43:08 +0900

岡部でございます。

> このツールを使ってコンバータした本文に

> 余談ながら、上記のツール、変換作業にDOS窓からコマンドを打ち込んで
> ひとつひとつコンバータしてゆくのは、

「コンバートする」「コンバートしてゆく」にご訂正下さいまし。
汗顔の至りでございます。穴があったら出たい…



From: (SATO Hiroaki)
To: "lex List Member" <>
Subject: [lex] 「歯磨き粉」余聞 {03}
Date: Tue, 22 Dec 1998 15:25:35 +0900

書き間違いがありましたので,修正します。

At 11:16 AM 98.12.22 +0900, SATO Hiroaki wrote:
>しまう場合もあると思います。それと,日本語字幕は,なるべく文字数を減らす,と
>いう原則があるので,1文字少ない「歯磨き」が好まれたのかもしれません。
「それと....好まれたのかもしれません。」はカットです。

>手持ちの映画で調べると,古い映画でも「歯磨き」という字幕でした。(この場合も,
>日本語字幕はもう少し後の年代に作られていると思います。)
「古い映画でも」でなく,「古い映画では」に変えます。
___________________
(SATO Hiroaki)
http://www.senshu-u.ac.jp/~thc0408/
〒214-8580 専修大学8号館8411研究室
佐藤弘明 専修大学・商学部・助教授(英語)



From: yasuko Okabe <>
To: "lex List Member" <>
Subject: [lex] 「歯磨〜」@新潮 {01}100冊
Date: Tue, 22 Dec 1998 15:25:40 +0900

奈良女子大学の岡部(国語学)でございます。
まだ立ち直れませんが気を取り直しまして、ご報告の続きをば。

「新潮文庫の100冊」から検索で得られたハミガキ関係の用例は、以下の
5例でした。

(1)
> そこで彼は思い出したように煙草を喫んだ。契み終ると、灰皿の代用
> 品である歯磨粉の空缶の中に、それを捨てた。
>(福永武彦「草の花」冬 1954)

(2)
> しかし寝台の上に胡坐をかき、歯磨粉の缶に煙草の灰を捨てている彼の
> 姿は、いかにも孤独に見えた。(同上)

(3)
> 汐見は微笑し、いつもの歯磨の缶に短くなった煙草を捨てた。(同上)

(4)
> 「艦政本部の谷村が、護身用だといって、こんな物を作ってくれた」
> と、催涙剤だかくしゃみ剤だかを、歯磨のチューブのようなものに詰め
> こんだ物を、面白いおもちゃみたいに人に見せていたこともある。(阿
> 川弘之「山本五十六」第七章・九 1965)

(5)
> 石鹸は米糠、苛性曹達などで作ったものを貰ったり、乳剤を闇買いした
> りしておりました。<中略>歯磨粉が無くなってからは塩を使っており
> ました。(井伏鱒二「黒い雨」4 1965)

(1)〜(3)は同じ作家の同じ作品に現れるもの、いずれも缶に入っている
あたり、あの懐かしい粉状の、まさにハミガキ「粉」のことでしょう。
にも関わらず、(3)だけは「粉」のない「歯磨」の語が用いられていて、
同一の作家でも揺れがあったことが知られます。
(4)はチューブに入っているからには当然ペースト状の練り歯磨きを指す
と思われ、(5)は、物語の舞台が太平洋戦争末期の1945年ですからモノと
しては粉のアレであった可能性が高そうです。だとすれば(4)(5)におい
ては、それぞれ語が指し示す対象と語形としての「粉」の有無とが一致
していることになりましょうが、いかんせん用例が乏しいので、ここか
らすぐさま語史そのものを伺い知ることにはならないようです。

なお、(3)の例のように、明らかに粉状のモノを指すと考えられる場面で
「はみがき」の語形が用いられていることからも、モノが粉状のそれで
あった時代からすでに、「粉」を欠く「はみがき」という語形は、行い
としての「歯を磨くこと」だけでなく、同時に、そのための「歯磨き材」
をも指し示したと考えられましょう。
「は+みがき」と同じく、<名詞+居体言*>の構造を持つ「ゆ+のみ」の
語も、「湯飲み茶碗」の省略形というよりは、「湯飲み」それ自体で湯
茶を飲む道具としての食器をも指し示し得たのではないか、とかねてか
ら考えております(日国**など一般的な辞書での記述は「省略」説を採用、
ただし「湯飲み茶碗」の用例の初出は、必ずしも「湯飲み」の用例の初
出より年代的に先行しない)。これと同様「物干し」の語も、これが「物
干し竿」や「物干し台」などを指すことは、必ずしも「竿」や「台」の
省略としなくてよいのではと考えます。
    *居体言(きょたいげん);動詞の連用形がそのまま名詞として
               用いられるもの。
   **日国(にっこく);小学館『日本国語大辞典』
粉状からペースト状への、モノの切り替わりの時期と、ことばとしての
「はみがき」と「はみがきこ」との使い分けの問題とは、別の次元のこ
ととして扱わなくてはならないかもしれません。

Tue, 22 Dec 1998 12:26:18 +0900 ,
k itaya <> 様 wrote:
> ・練り歯磨きはいつからありますか
> 『明治中期に資生堂が商品化している筈』

明治期の総合雑誌『太陽』に、ハミガキの広告を見かけたようなおぼろ
げな記憶がかすかにありますが…残念ながら、粉か練りか、そもそも本
当にそのような広告があったかすら、記憶が定かではありません。1901
年分の部分コーパス(非公開)を今探した限りでは、引っかかりませんで
した(落胆)。

いつもながら長文失礼いたしました。

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: kazuo kato <>
To: "lex List Member" <>
Subject: [lex] 「歯磨〜」@新潮 {01} 100 {01}冊
Date: Tue, 22 Dec 1998 17:39:46 +0900

岡部様:

加藤@岩手医大です.「居体言」についてのご考察興味深く拝見しました.

yasuko Okabe wrote:

> 「は+みがき」と同じく、<名詞+居体言*>の構造を持つ「ゆ+のみ」の
> 語も、「湯飲み茶碗」の省略形というよりは、「湯飲み」それ自体で湯
> 茶を飲む道具としての食器をも指し示し得たのではないか、とかねてか
> ら考えております(日国**など一般的な辞書での記述は「省略」説を採用、
> ただし「湯飲み茶碗」の用例の初出は、必ずしも「湯飲み」の用例の初
> 出より年代的に先行しない)。これと同様「物干し」の語も、これが「物
> 干し竿」や「物干し台」などを指すことは、必ずしも「竿」や「台」の
> 省略としなくてよいのではと考えます。
>     *居体言(き蛯スいげん);動詞の連用形がそのまま名詞として
>                用いられるもの。
>    **日国(にっこく);小学館『日本国語大辞典』

「湯飲み」と似た機能を持つ「吸い飲み」,あるいは「水差し」なども同じ例
でしょうか.

英語にも似たような現象があるのではないかと思います.例えば,
washing(s)「洗濯物(洗う前と後の両方)」; knitting(s)「編み物」;
reading(s)「読み物」; writing(s)「書き物」などがすぐ思い浮かびますが,
「湯飲み」や「吸い飲み」のような道具自体を指示する -ing(s) があるかどう
かはもうちょっと調べてみなければなりません.  

加藤 和男



From: "Hiroshi Shoji" <>
To: "lex List Member" <>
Subject: [lex] 新潮 {01}100冊・テキスト読み出しツール {01}
Date: Tue, 22 Dec 1998 10:15:34 -0000

東海林@バーミンガムです。

岡部様:

> ディレクトリをフォルダと呼ぶことも、そういえば Microsofteseだったの
> ですね!すっかり毒されているのを自覚した次第です…

これはちょっと違うのでは?
Graphical User Interfaceとしては先に普及したApple社のMacintoshでは以前か
ら普通にフォルダと言っていたわけで、私は「いつのまにか」Microsoftが同じ
呼び方をしているのに驚きました。
Microsoftでは「よくあること」なのだと思いますが…

「エイリアス」(alias)に相当するものを「ショートカット」(shortcut)と
呼ぶことは違っていたりはしますが、両者のOSで同じ呼び名をしていることは多
いと思います。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
To: "lex List Member" <>
Subject: [lex] 大学の教室 {01}
Date: Tue, 22 Dec 1998 10:45:05 -0000

東海林@バーミンガムです。

金子先生と同じように、私も送信したつもりのメールがリストに配信されていな
いという経験をしました(12月16日)。
以下の内容がそれです:

'School'の話題に関連して…

少なくともイギリス英語では、大学の教室は'classroom'と呼ぶよりは、

階段のある大教室(講義室):lecture theatre、または単にtheatre
普通教室(講義室):lecture room
ゼミ教室:seminar room

あたりが適切ではないかと思います。

Random House Unabridged Electronic Dictionaryのtheaterの項には、

4. a room or hall, fitted with tiers of seats rising like steps, used
for lectures, surgical demonstrations, etc.: Students crowded into the
operating theater.

とあり、アメリカ英語でもtheaterが階段教室の意味で使われることがわかりま
す。
日本の和英辞典の「教室」の項でもこの種の情報を載せてほしいものです。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 村田 年 <>
To: "lex List Member" <>
Subject: [lex] 自由連結の重要性 {01}
Date: Wed, 23 Dec 1998 00:52:03 +0900

村田 年(千葉大)です.

小生長い間気になっていることがひとつありまして,それを南出先生の
ご著書の記述に反論するというよりは,それがきっかけで投稿させていた
だき,みなさんのご意見をいただければと思った次第です.
よろしくお願い致します.

    コロケーションにおける「自由連結」について

南出康世先生の『英語の辞書と辞書学』はどこを読んでも教えられるこ
とが多く,感謝の気持で参照させていただいています.

最初に読んだときから気になった点がひとつだけあります.それはコロ
ケーションにおける「自由連結」の評価とその扱いです.先生は次のよ
うに書いておられます.

しかし,このような「自由連結」(free combination)として生じる動
詞の生起数を数量的に表示してもあまり意味がない.―p.66

南出先生は語の連結を,イディオム―コロケーション―自由連結,とし,
コロケーションの研究とその辞書への記述の重要性を説かれています.自
由連結の研究とその辞書への記述を意味がないとは言われていないが,重
点はコロケーションにあって自由連結にはないようです.これは現在ほと
んどの文献の主張と同じ方向でおそらくもっとも正しいとされる観点で
しょう.

BBI Combinatory Dictionary of English を見ても word combination に
は habitual combination と free combination とがあり,前者のみを記
述し,偶然の結合である後者を記述することは得策でないとしています(p.ix).

おそらくこの見解は辞書学の常識かも知れません.しかし私はどうしても
この見解に組みすることはできません.1992年にコービルドへ行ったのも
この「自由連結記述の正当性を証明する」ためで,十分その手がかりは
あったと思って帰ってきました.

1.狭義のコロケーションと自由連結の区別は学習者にはわからない.

南出先生は big tree(自由連結)と deciduous tree(コロケーション)と
をあげて自由連結とコロケーションとの差を説明しています.この場合はわ
かりますが,実際にはこの違いは微妙で判断できないケースは想像以上に多
いと思います.
例えば,BBI は Problem のコロケーションとして次の形容詞をあげています.

problem: acute, complicated, delicate, difficult, easy, emotional,
insoluble, insurmoutable, involved, knotty, major, minor,
perennial, petty, physical, pressing, psychology, serious,
simple, social, ticklish

上記の語との連結がコロケーションであって,そこにあげられていない
real, whole, main, same, pariticular, basic, central, great, big,
economic, practical, different, complex(これらはいずれも複数のコ
ーパスにおいて生起頻度が高い形容詞です) などとの連結はコロケー
ションではなく自由連結であるとしたら,その判断の差はどこにあるので
しょうか.

実は私の主張は「コロケーションと自由連結との差がわからないから」と
いった消極的なものではありません.もっと積極的な意義を自由連結に認
めているわけです.

2.自由連結の生起数は相当程度に普遍性がある.

例えば problem についてあるコーパス(コービルドの 1992年当時の
Corpus Twenty(現代イギリス英語を中心とした2000万語のコーパス))
での Modifiers + Problem の生起頻度数は次のようになっています.

this 175    whole 29     that 19
no 114 main 26 central 19
real 51 difficult 24 any 17
one 40 only 22 biggest 16
major 40 same 21 great 15
serious 37 particular 20 big 15
another 34 basic 20 social 14(以下略)

その後これを現代アメリカ英語を中心としたコーパスその他と突き合せて
みて,予想通り相当の普遍性が認められることを確認しました.私はパソ
コンもインターネットもよく使えないので,この点多くの方に確認してい
ただければと願っています.生起数の普遍性の程度はイディオムでも狭義
のコロケーションでも自由連結でもほとんど差がない,というのが私の受
けた印象です.
もちろん用例もこの生起頻度数を踏まえて選ばなければなりません.最新
版の LDOCE3,COBUILD2 はそのようになっていると見ています.自由連結
だからたまたま思い浮かんだ用例を(ネイティブ・スピーカーであって
も)辞書に書くのは適当ではないわけです.

3.生起頻度数の高い連結の意味がその語の Core Meaning となる.

ある語の中核的意味が上のように規定されるとすれば,まさに自由連結が
語の意味を決めるといってもよいと思います.一般の学習辞典であっても
語源を含めて歴史的に語の意味を記述すべきだとの立場なら話は別になります.

4.日本語からの干渉により誤りやすい語結合に重点をおいて記述する

英語学習上誤りやすいものを記述するのはもちろん大事ですが,干渉が生
じない例も大事です.なぜなら,
「演説をする」 make/*do a speech
「調査をする」 do/*make research
 
この2例において do research は干渉が少ないから記述する必要性も,
教える必要性も少ないとは言えないでしょう.なぜなら do でいいのか
どうかに学習者は自信がないのですから.作文などでこれでいいのかなー,
と思って調べてもどこにも書いてないことがあって,これが案外学習を
妨げるわけで,干渉が少ない例も同じように重要です.それではどうした
らいいか.1つには生起頻度の高いものを採用する(主に受信用ですが
出会う率が高いわけです.発信に使う率も高い場合が多いはずです).
もうひとつにはもっぱら発信を配慮した用例があります(この点は別の
機会に論じたい).

長くなりましたのでこのへんでやめます.
ご意見いただければありがたいです.特にコーパスに強い方々から.



From: Nagayuki Inoue <>
To: "lex List Member" <>
Subject: [lex] 辞書学MLの不具合 {01}
Date: Wed, 23 Dec 1998 08:07:44 +0900

辞書学ML登録者各位

日ごろは辞書学MLをご利用いただきありがとうございます。おかげさまをもち
まして,現在247名にものぼる方々に登録していただいており,日々活発で有益な
議論が展開されております。

さて,数人の方からご指摘を受けておりますが,17日に外的理由でMLサーバー
ソフトに不具合が生じました。皆様にはご不便をおかけしましたことをお詫び申
し上げます。

※当初,17日はたまたまMLへの投稿がなかったものと勘違いしており,送信
不具合の発見が遅れました。重ねてお詫び申し上げます。

今後ともよろしくお願い申し上げます。<m()m>

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: "Hiroshi Shoji" <>
To: "lex List Member" <>
Subject: [lex] 自由連結の重要性 {02}
Date: Tue, 22 Dec 1998 23:48:12 -0000

東海林@バーミンガムです。

村田先生が提起された問題点は、現在の私の研究テーマに深く関わっております
ので、及ばずながらコメントさせていただければ幸いです。

最初にお断りしておきますが、南出先生の御著書は海外滞在中ということでまだ
拝読しておりません。
ですから村田先生の引用された部分のみを手がかりにするしかありませんので、
誤解がある恐れもあります。
この点御配慮いただき、間違い等ありましたら御指摘いただければと思います。

村田先生:

> 1.狭義のコロケーションと自由連結の区別は学習者にはわからない.

この点、私もまさに同感です。
私は更に一歩進めて、

「狭義のコロケーションと自由連結の区別は学習者のみならず、研究者・レキシ
コグラファーにもわからない」

と言ってしまいたいと思っております。
「コロケーション」を理論的に定義し、「自由連結」と区別しようという試みは
これまでもなされてきたわけですが、どんなにもっともらしい定義で区別しよう
とも、村田先生のおっしゃる通り、「実際にはこの違いは微妙で判断できない
ケースは想像以上に多い」と言えると思います。

私としては、

ある基準語(Node)とそこから一定範囲(Span)までに共起する語
(Collocate)との組み合わせを頻度に関わらず「コロケーション」と呼ぶ立場

をとりたいと思います(John SinclairやJeremy Clearの立場と同じです)。
すなわち、「広義のコロケーション」という考え方です。

けれども辞書学的に、特に学習辞書の観点から重要な連結というのは確かにある
はずです。
これまではレキシコグラファーの言わば「職人芸」によってそれを抽出し、記述
する試みがなされてきたと思います。
ここ数年は巨大コーパスによって、ある程度数量的な処理により、「重要な連
結」の客観的な抽出方法が可能になりつつあると言えるでしょう。
その「数量的処理」に関して、村田先生は「生起(頻度)数」の重要性を説いて
いらっしゃいます。
この「頻度重視説」に関しては、私は賛成しかねます。
現在の私の研究データから例を挙げさせていただきたいと存じます。

「強調副詞+形容詞」(Bank of English <full version> より)

(a) abstract
very abstract: 28件、highly abstract: 26件

(b) academic
very academic: 32件、highly academic: 17件

(c) intelligent
very intelligent: 232件、highly intelligent: 220件

さて、abstract, academic, intelligentの項に強調語との連結を示すとしま
す。
コーパスにおける「頻度」を基準にするのであれば、上記の提示順に示し、ス
ペースの制約がある場合にはveryのみを載せるという結果になります(もちろん
強調語との連結は載せないという選択肢もありますが)。
けれども果たしてこれが適切でしょうか?
答えは2つあると思います。

<解答1>適切である
初級者向けの学習辞典の場合、用例の語彙には十分に気を配る必要があり、その
際には基本語のveryとの連結で十分という判断もありえると思います。

<解答2>適切ではない
中級・上級向けの学習辞典の場合、学習者が当然知っていると思える基本語very
との連結を先に、あるいはそれだけを提示することは効果的とは思えません。
スペースの制約がある場合、むしろhighlyとの連結のみを提示する方が「感覚的
にも」使用者の学習効果が上がるように思えます。

「感覚的にも」と書きましたが、Bank of Englishに備わっているt-score,
MI-scoreという2つの統計分析は、highlyとの連結を重要視するための「客観
的」手がかりを与えてくれると思います。

8か月以上にわたるバーミンガム大学への滞在で、コロケーション分析における
統計処理の重要性を痛感しました。
Sinclairの言う'idiom principle'がどの程度はたらいているかということを客
観的に知る方法としては、純粋頻度に頼るよりも統計分析を実施する方が理にか
なっていると思います。

ここまでをまとめますと:

1.言語感覚のみに頼る(狭義の)コロケーションと自由連結の区別には限界が
ある(村田先生と同意見)。
2.コロケーションを広義にとらえ、自由連結との区別をあえておこなわない
(Sinclair, Clearのやり方)。
3.特に中・上級向けの学習辞典に収録するコロケーションを抽出するために
は、純粋頻度に頼るよりも統計分析が有効である(Bank of EnglishのtやMI)。

ということになります。

もっと書きたいことはあるのですが、今回はここまでにさせていただきます。
長文失礼致しました。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 村田 年 <>
To: "lex List Member" <>
Subject: [lex] 自由連結の重要性 {03}
Date: Wed, 23 Dec 1998 14:11:41 +0900

    自由連結の重要性(3)

村田 年(千葉大)です.
東海林先生,さっそくにありがとうございます.

先生のお説にほぼ全面的に賛成です.
頻度主義を主張するあまり,記述に余裕がなくて,辞書に掲載する際,
また実際に教える際の判断までは述べることができませんでした.

very というたいへんわかりやすい事例で説明していただいたわけですが,
単純な頻度数のみを考えているわけではありません.t-score, MI-score
といった統計処理に言及するのは次の段階かと思っていたわけです.(私
自身このような score のことは十分に理解しているわけではありません.)
具体的な辞書の記述の場合できうる限り統計上の数値に頼るか,執筆者の
経験による判断に頼る面を多くすべきかの議論はさらに先だろうと思って
おります.

まずは自由連結の重要性に組みする方がどのぐらいいらっしゃるかを
知りたかったわけです.

再度もうしますが,南出先生のご著者の記述は私の主張のきっかけです.
先生は自由連結すべてを記述の価値がないとしているわけではなくて,
コロケーションとして意義のある連結,英和・和英辞典ならば日本語との
干渉でユーザーにとって有益な連結を掲載すべきだという趣旨のことを
述べていると受け取りました.誤解があるかも知れません.

南出先生にもご著書への反論に答えるというより,自由連結をどう考えて
おられるか,伺うことができれば幸いです.



From: "Hiroshi Shoji" <>
To: "lex List Member" <>
Subject: [lex] 自由連結の重要性 {04}
Date: Wed, 23 Dec 1998 09:28:28 -0000

東海林@バーミンガムです。

村田先生、先生のお考えを一部誤解していたようで申し訳ございませんでした。
今回は「自由連結の重要性 {01}」に関連して、もう少し述べさせていただけれ
ば幸いです。

> 2.自由連結の生起数は相当程度に普遍性がある.

これは特に頻度の高い基本語をnodeとした場合に顕著な現象だと思います。
個人的経験からも、頻度が低めの語に関しては、コーパス規模が小さいと連結の
生起数の信頼度は極端に落ちると思います。

> 3.生起頻度数の高い連結の意味がその語の Core Meaning となる.

「生起頻度数の高い」の部分を「統計的有意さが大きい」と置き換えれば全面的
に賛成できます。
実際、統計的有意さの順に連結を並べてみると、基準語(node)の語義ばかりで
なく、そのsemantic prosodyがわかることが多いのです。

> 4.日本語からの干渉により誤りやすい語結合に重点をおいて記述する

以下、先生は「干渉が生じない例も大事」と述べていらっしゃいます。
まさにおっしゃる通りで、特に用心深い学習者は「自分の思いつく連結は母語干
渉ではないか」と考えてしまう傾向があると思います(時には他の連結からの類
推で、hypercorrectionの危険性もあります)。
スペースに余裕があれば、そのような学習者に安心感を与えることも学習辞典で
は必要な配慮かと思います。

最近コロケーションと母語干渉の問題に関して気になっていることの一つに、
「特定言語固有のmetaphor適用」があります。
この点に関しては只今勉強中で、いずれどこかに発表させていただきたいと考え
ております。

皆様、良いクリスマスを!

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 南出 康世 <>
To: "lex List Member" <>
Subject: [lex] free combination について {01}
Date: Wed, 23 Dec 1998 22:24:00 +0900

村田先生から提案された問題は大変興味があります。『英語の辞書と
辞書学』(以下『辞書学』を補う意味もかねて私の意見を述べてみます。

まず自由結合とコロケーションの差ですが(村田先生は自由連結として
紹介されましたが、私は『辞書学』では自由結合を使っています。べつ
ににこだわりませんが頭が混乱してくるので自由結合の方を使わせてい
ただきます)、両者は固定したものでなく相対的かつ流動的なものとし
て捉えるべきと思います。たとえば、a big apple を習ったばかりに人
にとってはbig の選択制限はほとんど白紙ですからa big tree は自由結
合ではないかもしせん。私がこれを自由結合の例にしたのはもうすでに
bigの基本的な選択制限(たとえば、[_+physical object])を頭に入れた
読者を想定したからです。このように自由結合とコロケーションの差は相
対的・流動的ですから、ある特定の語結合を示してこれは自由結合とコロ
ケーションのいずれかと問われても答えられない場合が多いでしょう。だ
からといって自由結合とコロケーションの区別が不要ということにはなら
ないと思います(後の議論で明らかなように区別があった方が便利です)。
さらに私はこの区別を学習者に求めていません。辞書を作る側の人間が頭
に入れておくべきこととして捉えています。
 それに村田先生のご主張は「「コロケーションと自由連結との差がわか
らないから」といった消極的なものではありません.もっと積極的な意義
を自由連結に認めているわけです」ということですので、次の議論に移り
たいと思います。

議論の材料として村田先生が示されたコーパスデータを使います。

例えば problem についてあるコーパス(コービルドの 1992年当時の
Corpus Twenty(現代イギリス英語を中心とした2000万語のコーパス))
での Modifiers + Problem の生起頻度数は次のようになっています.

this 175    whole 29     that 19
no 114 main 26 central 19
real 51 difficult 24 any 17
one 40 only 22 biggest 16
major 40 same 21 great 15
serious 37 particular 20 big 15
another 34 basic 20 social 14(以下略)

This との生起頻度が突出しているので話をこれに絞ります。this は単数
名詞とほぼ無制限に生起して相手を選びませんので、this problem は典
型的な自由結合の例です。私の立場は「このような「自由結合」(free
combination)として生じる生起数を数量的に表示してもあまり意味がな
い」ですから、辞書の用例にthis とproblem が結合したものを含めたり、
this と連語する事が多いことを注記で指摘する必要は認めません。これが
分析の第一段階です。さてproblem には、assumption, explanation,
proposal などとともに、これまで述べてきたことをまとめる前方照応の用
法があることが指摘されています。Vocabulary 3 (Winter, 1977),
Discourse Organizing Word (McCarthy, 1991), A-noun (Bloor &
Bloor, 1994)などと呼ばれているものです。この用法ではthis を伴うのが
普通です。上のデータでthis との結合が突出しているのはこの用法を反映
しているのでしょう。第一段階の分析で一見無意味と思われる数値に
problem のcore meaning に関わる重要なてがかりが隠されていたという
ことになります。このVocabulary 3に関する情報は英和辞典に必要と思わ
れます。取り入れるとすれば、先行文の内容をthis problemで受けた用例
(かなり長いものになります)が必要になります。このことから「自由結合
の数値を示してもあまり意味がない」という主張はやや修正する必要がある
かなという気がしています。ただ、一見無意味に見える自由結合とその頻度
数にいつも有用な意味が隠されているというわけでありません。たとえば、
appleという語のコーパスに、this apple の例が40含まれていたとします。
しかしこれからapple という語のcore meaning に関わる重要な情報を引き
出せそうにありません。「自由結合の数値を示してもあまり意味がない」に当
てはまります。
 意義のある情報を伝えて初めてコーパスの数値は意味を持つというのが私
の立場です(私は英和辞典編集者の立場からものをいっているので、ここで
「意義がある」とというのは、日本人英語学習者が英語を発信したり受信し
たりする上で寄与するという意味です)。意義のある情報を伝えない数値は
無意味ということになります。村田先生お立場は、「自由連語の中にこそ
core meaning を探るてがかりがある」だと思いますが、this apple (40)
はどのような意味を持つのでしょうか。よろしくご教示ください。

このメールを投函する直前に東海林先生のメールを拝見しました。ご返事はま
た後ほどに。

〓∵〓南出康世 〓∵〓
[電話0743-75-7050. FAX 0743-75-7050]
[e-mail ]



From: Kazuhiro Sugimoto <>
To: "lex List Member" <>
Subject: [lex] diary / agenda {02}
Date: Wed, 23 Dec 1998 23:39:51 +0000

埼玉の杉本です。

「手帳」について、毎日使っている物だけに興味深く拝見しました。
昨日手帳を求めたとき、見ると英・米・仏・独・ベルギーの輸入ものも
何種類もあって、さすがに丸善だなと思いながらメモをしてきました。

先ず、話題になった"Agenda"と名のつくものが2種類ありました。
1) Brepols社(ベルギー)
  表紙: Agenda / 1999 / Brepols
   Title page(というのかどうか分かりませんが)は
     ecorama / 1999 / Brepols
2) Quo Vadis社(英・米・カナダ・オーストラリア)
Agenda Planning Diary
これには "Choose The Planning Diary"と始まる宣伝文句の入った
   帯が付いています。

● 次のようなものもあって、Lexicon様の書かれた通りと思いました。

  3) At-A-Glance社(米)
a) "DayMinder 1999"
   b) "Fine Appointment Diary"

Lexicon wrote:
> 米国では手帳のような物を'agenda'と呼ぶことは普通ありません。カナダに
> 'agenda'と表紙に書かれた物があるということですが、これはその物体の呼
> び名が表紙に記されているというよりは、それが「本来」'agenda'を書き込
> む為のノートブックであるということだと解釈すべきでしょう。'agenda'と
> いう言葉自体は、いうまでもなく(少なくとも米国では)とても一般的な日
> 常語で、それが本のような物体を指すようなことはまずありません。他の例
> を挙げていうならば、仮に'my schedule'と表紙に記されたノートブックの
> ような物体があった時、その物体そのものが'my schedule'ということでは
> 無論なく、'my schedule'とはその内容であるということです。'agenda'の
> 場合でもそれと同様のことが言えると思われます。

他には、
 4) Newsweek社(米)
  表紙: "Newsweek" 
  Title page: "International / Pocket Diary / 1999
(Time のもありましたが、こちらは表紙にただ "Time 1999"(Title page
   なし)。これは誰がどこから見ても手帳以外の何物でもないので「手帳」
   という文字を入れてないのかなと思いました。次のLetts社のにもそう
いうのがありました)
 5) Letts社(英)
表紙: 1999
  Title page: Diary 1999

● Letts社のはサイズの少し異なるたくさんの種類が置いてあって、
手帳の老舗なのでしょうか、どの title pageにも

   For over 200 years, Letts of London has made diaries and
appointment books using time-tested craftsmanship and the latest
technology to create products that are classic in every sense of
the word.

とあります。

> また、'diary'という語も
> 『手帳』という意味では通常使われません。'diary'という語は、やはり過去
> に起きたことを記録するという語義が、米国では支配的なようです。

以上、実物を見ると「手帳」に当たるのは、英米共に単に"diary"、または
"pocket diary"というのが普通のようです。



From: "Akinobu TANI" <>
To: "lex List Member" <>
Subject: [lex] PC表現レスありがとうございました {01}
Date: Thu, 24 Dec 1998 14:23:02 +0900

飯塚様、寺元様

PC表現についての参考書をご教示いただき
ありがとうございました。

文献を検索すると多くのものがあるのは
わかるのですが、その中からどれを選べば
良いのかわからなかったので、参考に
させていただきます。

-------------------------------------
武庫川女子大学文学部英米文学科講師
谷 明信(Akinobu TANI)

663−8558西宮市池開町6−46
TEL 0798−47−1212(代表)
-------------------------------------



From: kazuo kato <>
To: "lex List Member" <>
Subject: [lex] 分離不定詞と「ら抜き言葉」 {01}{01}{01}{01}
Date: Thu, 24 Dec 1998 14:57:43 +0900

加藤@岩手医大です.

11月27日に「分離不定詞」と「懸垂分詞」をタブー視する,次の文章をこの欄
に紹介しました:

> Split Infinitive について次のような文章を見かけました.この間大統領の
> 弾劾問題を審議する米国下院法務委員会(the House Judiciary Committee)
> の証人として証言した,特別検察官 Ken Starr の英語について Mary McGrory
> というコラムニストが次のようにコメントしています:
>
> His [Ken Starr's] style is right out of a legal brief, a marvel of
> long, looping sentences that came to rest always with all loose ends
> tucked in, no dangling participles or split infinitives.
> (The Washington Post, Sunday, November 22, 1998; C01)
>
> Ken Starr の英語は,長い,従属文を多用した文でありながら,係り結びがき
> ちんとしていることを評価しているわけですが,いわゆる懸垂分詞と分離不定
> 詞をしまりのない英語の代表として出しているのが面白いと思いました.

昨日,次のような文章を見かけて,ひょっとするとこれは cliche の一種かも
しれないと思った次第です.これは60年代のオーストラリアの話です:

He particularly admired the writing of Ross Cambell, a columnist who
never split an infinitive or dangled a participle.
----Geraldine Brooks, Foreign Correspondence: A Pen Pal's Journey
from Down Under to All Over (Anchor Books, Doubleday, 1998) [ISBN
0-385-48269-8], p. 32

文中 "He" というのは作者の父親です.作者自身は分離不定詞を使っています.



From: Hirosada IWASAKI <>
To: "lex List Member" <>
Subject: [lex] アクティブジーニアス英和辞 {01}典
Date: Thu, 24 Dec 1998 15:31:12 +0900

ジーニアスファミリーの最新刊『アクティブジーニアス英和辞典』について
ご存知の方にお聞きします。

本辞書は、『ジーニアス』と『フレッシュジーニアス』の中間ということ
になるかと思いますが、もう1つ性格がはっきりしません。前書きでは
オラルコミュニケーション用の用例を増やした点が強調されておりますが
紙面を見る限り、必ずしもそれがポイントとも思えません。

その他のポイントとしては、語彙数を4万3千に限定(HPでは、4300と
いう数字がありますが、これは収録数の桁間違いでしょうか?)、
『ジーニアス』の語法・文法説明を簡略化といった点だと思います。

そこで、質問ですが、この後も『フレッシュジーニアス』は残るので
しょうか。つまり、『アクティブ』は『フレッシュ』を改称したもの
と考えるのが自然なようにも思えるのですが(前書きでは並列している
と解釈できます)。

私個人の推測では、書名でGeniusとのコロケーションがおかしいFresh
を改称し、文法を簡略化した本書を高校向けの主軸とし、『ジーニアス』
の方は、次版ではカレッジ版に転進するのかと思っているのですが
(この点は推測ですので、関係者の方のコメントは不要です)。

差し障りのない範囲で、教えていただければ幸いです。

磐崎弘貞@筑波大学
 



From: yasuko Okabe <>
To: "lex List Member" <>
Subject: [lex] {01}「歯磨〜」@新潮100冊
Date: Thu, 24 Dec 1998 18:54:18 +0900

奈良女子大学の岡部でございます。

Tue, 22 Dec 1998 17:39:46 +0900 ,
kazuo kato <> 様 wrote:

> 加藤@岩手医大です.「居体言」についてのご考察興味深く拝見しました.
<中略>
> 「湯飲み」と似た機能を持つ「吸い飲み」,あるいは「水差し」なども同じ例
> でしょうか.

レス&フォローありがとうございます。仰る通りでございます。
先のポストで書き漏らしましたが、何かの省略として捉えにくいもの、
省略する前の完全な語形をやや想像しにくいものとしては、他に「缶切
り」や「鉛筆削り」などが挙げられましょうか(あえて補うならば「缶
切り器」「鉛筆削り器」ということになりましょうが)。

同じ語構成のものでも、道具を指すとは限らず、「稲こき」や「麦踏み」
などは動作そのものを表し、「太鼓持ち」「火消し」「もぎり」などは
動作主のヒトを表す(場合によっては職業名などとして固定)、といった
具合に、名詞のさらに下位分類としてのどの範疇を指すかは、語により
まちまちのようですので、「歯磨き」とてなかなか油断なりません。

> 英語にも似たような現象があるのではないかと思います.例えば,
> washing(s)「洗濯物(洗う前と後の両方)」; knitting(s)「編み物」;
> reading(s)「読み物」; writing(s)「書き物」などがすぐ思い浮かびますが,
> 「湯飲み」や「吸い飲み」のような道具自体を指示する -ing(s) があるかどう
> かはもうちょっと調べてみなければなりません.

なるほど。素人考えですが、英語の場合には動作の為の道具を指し示す
語形は、-erあたりが担うのでしょうから、それ以外には不要なのでしょ
うか。speaker,converter etc....
    (いまだ赤面↑)

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: yasuko Okabe <>
To: "lex List Member" <>
Subject: [lex] {01}新潮100冊・テキスト読み出しツール
Date: Thu, 24 Dec 1998 18:59:28 +0900

奈良女子大学の岡部でございます。

Tue, 22 Dec 1998 10:15:34 -0000 ,
"Hiroshi Shoji" <> 様 wrote:
> > ディレクトリをフォルダと呼ぶことも、そういえば Microsofteseだったの
> > ですね!すっかり毒されているのを自覚した次第です…
>
> これはちょっと違うのでは?
> Graphical User Interfaceとしては先に普及したApple社のMacintoshでは以前か
> ら普通にフォルダと言っていたわけで、私は「いつのまにか」Microsoftが同じ
> 呼び方をしているのに驚きました。
> Microsoftでは「よくあること」なのだと思いますが…

ああああこれは大変失礼申し上げました(冷や汗)。
たしかに、Windows95はMacのGUIを真似てあのように変わったと聞いて
知っていたつもりだったのですが… おそらく佐藤様のご教示下さった
この例↓あたりをきっかけに、勘違いをしてしまったようです。

Fri, 4 Dec 1998 12:00:21 +0900 ,
(SATO Hiroaki) 様 wrote:
> http://www.maxwell.syr.edu/maxpages/faculty/jbennett/651/124news.htm
> 006: he. The cache is simply a directory (in Microsoftese, folder) of
> files. This is done so th

ともあれ、ご教示ありがとうございました。

# 余談ながら、Windows95・98に謂わゆる「タスクバー」も、Macの真似
# でしたか…Mac暦の長い人は、Windowsを使っていてもアイコン類をデ
# スクトップの四辺にぐるりと並べ、タスクバーを画面の上辺に置いて
# 使うのだと何かで読んで、非常におもしろく感じた覚えがあります。

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: "浅田 幸善" <>
To: "lex List Member" <>
Subject: [lex] <New!> COBUILD E-dict {02}
Date: Fri, 25 Dec 1998 11:52:10 +0900

昨日三省堂(東京・神保町)に立ち寄ったところ、 COBUILD
E-dictが店頭に置かれていました。
価格は、確か\12,000でした。

発見?しただけなので、日本の書店でも入手できるようになりました、というご報
告のみにて失礼します。

浅田幸善 (ASADA Yukiyoshi)



From: IIZUKA Toshiaki <>
To: "lex List Member" <>
Subject: [lex] アクティブジーニアス英和 {01}
Date: Fri, 25 Dec 1998 12:02:43 +0900

TO:辞書学ML

           FROM: 大修館書店 飯塚利昭

===========================

磐崎弘貞 先生

 『アクティブ ジーニアス英和辞典』さっそくご覧いただき,あ
りがとうございました。お尋ねの点につき,とり急ぎ書きます。

 『アクティブ』は,『フレッシュ』に代わって高校生用の辞書の
中心となるべく編集されました。
 収録語句の数ですが,ホームページのデータは万の位の5が抜け
ておりまして失礼しました(訂正するよう指示しました)。正しく
は54,300で,内訳は,普通の見出し40,000,成句7,000,準成句7,3
00です。『フレッシュ』は55,000ですから,少し少なくなっていま
す。

 『フレッシュ』はもともと『ジーニアス英和』の高校生専用版と
いうことでしたが,基本語に関しては『ジーニアス英和』の記述の
大部分を引き継いでいて,やや難しい面もありました。また,『フ
レッシュ』は活版(古典的な鉛の活字)で作られているのですが,
印刷所では活版の組版をやめつつあるために,従来の方法での改訂
が難しくなったという事情もあります。
 そこで『アクティブ』は,『フレッシュ』『ヤング』の経験や読
者の要望を元に,『フレッシュ』より少し易しくする方向で編集し
ました。
 したがって,高校生用の辞書のレベルとしては,
   ジーニアス 10
   フレッシュ 8
   アクティブ 6
   ヤング   2
という感じになります。
 また前にこのメーリングリストで,基本語の数が話題になりまし
たが,この『アクティブ』では,Bランクを高校で学習する語とい
う観点から2050ほどに減らしました。

 用例は,ジーニアス・ファミリーで使っていたものを,かなり入
れ替えました。Newbury House Dic. of American Eng. の用例も使
用しています(一定数の使用権を取得)。

 よろしくご検討ください。

===========================
IIZUKA Toshiaki 飯塚利昭 大修館書店 編集第二部
           emial:


From: (Terutada Okada)
Subject: [lex] 牛津 {01}
Date: Fri, 25 Dec 1998 14:33:11 +0900

岡部様、岡田日大理工です.ご教示有難うございました.公務で文字通り目が回って
しまって御礼遅れました失礼お許し下さい.ブリジストンについては、大昔ブリジス
トン美術館にルオーを見に行ったときそこの沿革を読んで知りました.なかなかしゃ
れたことを考えるものだと感心した覚えがあります.「牛津」に関しては、確かに「
太陽」は早いですね.当時の「新語」はこういう雑誌を検索するのは有効のようです
.「美的」なる語も確か樗牛が「太陽」誌上で最初に使ったのではなっかたでしょう
か.以後この「〜的の」は「〜上の」との競争に勝ち随分勢力を得て今日の「〜的な
」にまで続いているようです.数年前(?)明治大正期の語彙の研究に国研が当時の
金額で1億だか2億だかの予算を請求したところ6百万円に削られてしまったことが
新聞誌上に取り上げられていました.私は悲憤慷慨(?)して行きつけの飲み屋で誰
構わず日本はいかに自国語を大切にしないか、官僚の脳梗塞性をおおいに宣伝(?)
しておりました.
 ところで、某社から中央大学の川戸教授が監修して明治期の翻訳/翻案の小説をマ
イクロフィルムにして公刊しているのはご存じだと思います.こうしたものは現在簡
単には目を通すことが不可能ですから大変貴重ですが、なにぶん高価ですから特別な
人以外は個人的に入手しようと思ってもなかなか手がでません.ですから国研あたり
がプロジェクトごと買い上げて、それをインターネット上で公開すれば多くの研究者
が便利をします.現在ではそれが可能になりました.これは「太陽」についても言え
ることですが.そこで研究なさる方々も含めて大勢の研究者がいろいろな角度から研
究でき、さらに情報量も増え、ひいてはOEDのような辞書作りも精度が増すでしょう
.文部省に国語政策というものがあるのか、ないのか私は知りませんが、せいぜい小
学校で修得する漢字の数を決める位のことしか念頭にないないようで、古典にしろ、
漱石、鴎外にしろその本文作りを民間に任せて平気でいられる官僚さん達の頭を洗脳
する必要があるでしょうが、このあたりは国研がどんどん率先してやってもらいたい
ものです.とあなたに申し上げてもせん無いことでしょうが、つい余計なことをかき
ました.ご無礼お容赦ください.祈願迎新春.



From: Minoru MURATA <>
Subject: [lex] 分離不定詞と「ら抜 {01}き言葉」 {01}{01}{01}{01}
Date: Sat, 26 Dec 1998 12:04:04 +0900

村田 年(千葉大)です.

たいへん興味深く,英語のおもしろさと難しさを思います.
先生の読書量には驚いております.
ありがとうございました.

kazuo kato <> さんは書きました:
> 加藤@岩手医大です.
>
> 昨日,次のような文章を見かけて,ひょっとするとこれは cliche の一種かも
> しれないと思った次第です.これは60年代のオーストラリアの話です:
>
> He particularly admired the writing of Ross Cambell, a columnist who
> never split an infinitive or dangled a participle.
> ----Geraldine Brooks, Foreign Correspondence: A Pen Pal's Journey
> from Down Under to All Over (Anchor Books, Doubleday, 1998) [ISBN
> 0-385-48269-8], p. 32
>
> 文中 "He" というのは作者の父親です.作者自身は分離不定詞を使っています.



From: yasuko Okabe <>
Subject: [lex] 訂正:「歯磨〜」@新潮 {01}100冊
Date: Sat, 26 Dec 1998 16:04:58 +0900

岡部でございます。

> 同じ語構成のものでも、道具を指すとは限らず、「稲こき」や「麦踏み」
> などは動作そのものを表し、「太鼓持ち」「火消し」「もぎり」などは
> 動作主のヒトを表す(場合によっては職業名などとして固定)、

申し訳ありません。「もぎり」は「同じ語構成」ではありません…
「キップ切り(もぎり)」のつもりだったのでした。道具ではなく人を表
すほうです、という意味でこう書こうとしたのですが…自分で書いてお
いて、投稿するときにその意図を忘れて「この例はちと長たらしいわい」
と縮めてしまったようです。

# 昨日は銀行の記入台で「ご印鑑拭き」の表示が目に止まったわたくし
# でした。

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: yasuko Okabe <>
Subject: [lex] {01}牛津
Date: Sat, 26 Dec 1998 16:06:41 +0900

奈良女子大学の岡部でございます。

岡田@日大理工 様、お忙しい中お返事ありがとうございました。
国研の国語辞典編集室の予算削減云々については、わたくしもそれに関
する新聞記事を切り抜いて、たしか今でもどこかにしまってあります。
予算と人員を三分の一に減らされてしまい、当初の計画でも大型国語辞
典編纂事業の完成には100年かかるなどと言われていたものが、これで
300年かかる計算に!(^^;;という話に、驚き呆れた記憶がありますが、
まさかその人員削減のおかげ(?)で(人手が足りず、非常勤研究員や通信
研究員を多数動員することになって)わたくしのような者までがのちに
その大事業に参画させていただくことになろうとは、当時まだぴよぴよ
の大学院生だったわたくしは(今でもまだまだひよっこですが)、夢に
も思わなかったことでした。
単純計算で300年といわれた大型電算化辞書ですが、その後コンピュータ
の機能や性能もめざましく進展し、便利なツールや方法もどんどん出て
きて、作業の進捗も当初よりは格段に能率化している(はずです)ので、
まさか300年はかからないと思われます(^^;;

例のマイクロフィルムは、わたくしの出身学科にあたる本学文学部の某
講座でも、科研費か何かの特別な予算枠を取って購入する(した?)と聞
いております。通常の図書費はただでさえ乏しい上に継続図書の購入に
圧迫されて苦しく、高価な物はなかなか買えません。ましてや個人での
購入は、おっしゃるようにほとんど無理でしょう。しかし国研がプロジェ
クトごと買い上げて、…というのも、現状ではなかなか実現も難しいよ
うです。国研でも、国際化時代の今、外国人のための日本語教育や日本
語教師養成などの部門などには予算も大きくつくらしいのですが、明治
期のようにほんの少し前のものでさえ、非・現代語に関する研究などは、
なかなかその意義や必要性を認めてもらえないようです。事業の有益性
を内外に知ろしめるためにも『太陽』コーパスをなるべく一般に公開し
て広く研究者の便宜に供する、という目標は、それじたい大変喜ばしい
ことではありますが、すぐにナニに結びつくだの、カニの役に立つだの
という華々しいこと以外には予算がつきにくいというのは、情けないこ
とではあります。このあたりの事情は研究所に限らず大学でも同様のよ
うで、例えば実験系の講座でないというだけで、多くの講座で助手のポ
ストすら取り上げられて、そのしわ寄せがあちこちに出ている現状には、
わたくしも疑問と憤りを感じざるを得ません。助手云々はともあれ、お
金にならないが全ての応用研究に不可欠なはずの基礎研究、成果が出る
までにしばらく時間を要する地味な研究こそ、企業や民間の研究所では
なく国立の研究機関が手がけるべきだという発想は、文部省には通用し
ないのでしょうか。ましてや自国の言語と文化に関する研究ですから、
これをないがしろにするようでは、国際社会における相互理解もおぼつ
かないのではと、大いに疑問を抱く次第です。

余談ながら最近では「じょう・そう・かん・じん」とか言うそうでござ
いまして(順序はうろ覚えですが)、情報・総合・環境・人間のキーワー
ドのついた学部や学科であれば、やっていることが同じでも、いただけ
る予算が格段に違うのだそうで。昨今身近なところで盛んにおこってい
る学部学科の改組改称も、先生方のご苦労と苦渋の選択の末のことと拝
察しつつも、名称を聞いただけで何が学べる学科なのかいまひとつピン
とこないわたくしは、すでに時代遅れの石頭ということになるのやらん
と、苦笑を禁じ得ません。

もの申す立場にもない若輩者が、ありがたいお言葉の数々に、つい感動
して書きすぎました。乱文お許しのほどを。(ログの公開を考えなけれ
ば、もっと憤懣をあらわにしたいところ ^^;)

MLの趣旨から外れる内容を、しかも毎度ながら長文で、たいへん失礼
いたしました。

===================
岡部 泰子

奈良女子大学 人間文化研究科・助手
(比較文化学専攻 言語文化論講座)

===================



From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}
Date: Sun, 27 Dec 1998 10:27:41 +0900

  自由結合の意味(6)

村田 年(千葉大)です.
南出先生と東海林先生にさっそく書込をいただきありがとうございま
した.雑用が多くてなかなか続きが書けませんでした.

0.南出先生の『辞書学』からの引用で「自由結合」を「自由連結」と
間違って引用したことをお詫び致します.私は「自由連結」と言ってい
るものですから.生起頻度数の多い順に何がなんでも,例えば,the,
a, his, your, this...の順だったら,この順で辞書に取り込んでいく
べきだと私が言っているように受けとられたようですが,それは幸い
でした.先ずは「自由結合の意義」をできる限り強調したかったので.

1.南出先生の「意味のあるコロケーション」と「意味のない自由結合」
との違いはなかなか理解するのが難しい点がありますね.辞書のユーザ
ーの学習段階の違いによって習得している選択制限の量の違いに応じて
その境界が動く,「相対的・流動的なもの」であり,また,母語の干渉
の程度によっても境界が動き,また,対象の Node によっても this
problem のように「意味のない自由結合」が「意味のある自由結合」
ないしは「コロケーション」に変わることがあると受け取れます.

このような考え方が優れた『ジーニアス英和』を作られたのだと理解
できますが,やはり名人芸,長年の訓練,多くの先行文献の蓄積等に
頼る面が多過ぎて,一方では執筆者による記述の差が出やすくなるし,
新たな執筆者(レキシコグラファー)の短期間の養成には向かないと
私は思っているわけです.

南出先生も教員が片手間に辞書を執筆するのではなく,専従のレキシ
コグラファーを英和辞典でも養成すべきだと言われていますが,時間
単位で働く専従は手当をあまり気にしない教師とは違うので効率を考
えなければなりません.また英語の力はあっても教育的な判断力は劣
っています.この場合も南出先生の方式では無理があるのではと思っ
ております.

2.一次資料としての KWIC(基準語(Node)を中心に例文資料を1行
ずつ提示するもの) と 生起頻度表の重要性

1) 前回あげた BBI における problem のコロケーションの例は 21例です.
2)『新勝股』には 149例が出ています.
3) 前回示したコーパス(Corpus Twenty)は一瞬にして 460例を頻度
数の多い順に(頻度 2までを)ディスプレーに出してくれます.

 BBI について.熟練のレキシコグラファーが先行辞書,文献,自己
の資料,内省による作例の中から「意味のあるコロケーション」を
21例掲載したわけですが,『新勝股』の 149例といった豊かな実例
があって,その中から検討の後 21例が決められたとは思えないふし
があります.
 例えば,real problem の real は Corpus Twenty で problem
と結ぶ1位の形容詞で 51例があります.他のコーパスでも頻度は
極めて高いわけです.この real が資料にあって検討されたのちに
捨てられたのであれば,それは一つの基準で処理されたわけでかま
いません.しかし前回 13例出しましたが,これらが検討にかけられ
て捨てられたとは考えにくいところがあります.(例えば
ticklish problem が採用されていますがどのレベルのユーザーを想
定しているのかと思います.)

 『新勝俣』の場合はコーパス(のような資料)があったわけです.
旧版の勝俣先生の 50万を越える用例,編集者の収集資料,出版社の資料,
ネイティブの作例,など.ただこのコーパスには頻度数がなく,また
目にとまったものを収集したという偏りがあります.その結果ある
コーパスで検討すると,頻度 100以上から 2, 1, 0が全編にわたって
混在することになります.1例しかなくても意味のありそうなものは
全部掲載しているわけです.

 コーパスの場合は非常に多くの資料を見やすい形で一瞬にして出し
てくれるわけです.機械的に単純な形で出してくれます.これはレキ
シコグラファーのあらゆる問題意識に道を示し,問題意識をもつこと
のない執筆者にも問題をもつ切っ掛けを与えてくれます.なんでこん
なに this が多いのだろう,the と a がまるで頻度が違うじゃない,
be動詞ばっかりで限定用法は少ないんだ,「主要な」という意味では
major 40, minor 7, main 26,chief 4, central 19 (problem につい
て)となっているが,単純には選べないな,MI-score を見て相対頻
度を取ってみるか,といった具合に仕事を進めるきっかけを与えてく
れます.

(南出先生への質問)意味あるコロケーションを決めるための資料を
どこに求めるのでしょうか.先行辞書の用例,コロケーション例,文
献の例などだけでは少ないでしょう.KWICに求めるとすれば,自由結
合とコロケーションの区別にこだわらない方が第一段階としては上策
でしょう.

3.相対頻度の求め方:東海林先生の very academic 32, highly
academic 17 について

 単純頻度表は全体を眺めてその語の概略を描くにはたいへんいいもの
です.上記の very と highly とに目がとまったとします.very の方
が頻度が高いから結合が強いと単純に考えるわけではありません.
highly と very では10倍以上生起頻度数が違うだろうと目星をつけ
ます.するとこの場合 highly は頻度 170として比較していいわけです.
少しやっているとこのような勘ははたらくようになります.心配なら
頻度を出してみます.仮に very 8000 highly 400 と出たとします.
相対頻度は20倍になり highlyの方がはるかに結合の度合いが強いこ
とがわかります.もちろん最初から MI-score を見てもいいのですが,
私は(自分が統計の扱いが下手なせいもあって)最初からは勧めません.

4.純粋頻度に頼るよりも統計分析の方が有効か?

 例えば,東海林先生のように目的意識を持って,コービルドまで出向
き,研鑽を積み,研究に使おうとする場合はでき得る限り統計分析に
頼って個人の判断を排除した方がいいでしょう.(時間単位でお金をも
らっているわけではありませんし,十分な判断能力を備えているのです
から)
 また東海林先生,井上先生,赤野先生といった先生方ならば,一定
時間に一定の行数を書く,英和辞典の執筆にもっぱら統計分析を使っ
てもいいかも知れません.
 しかしながら,私程度,あるいは私以下,初めて辞書の執筆に参加
する人の場合,何か月かの訓練があったにしても,現段階では一次資
料として KWIC と 純粋頻度が極めて有効だとの確信を得ています.
(何人かの人とグループを組み,実際に単語を執筆し,批評しあっ
た,1年以上にわたる自分の経験からそう思ったわけです.)

 統計分析の信頼度の問題もあります.t-score は相対頻度ですか
ら一応の完成を見ているのでしょうが,MI-score は意味の連想の
強さを頻度計算式で表わしているわけですから,統計学としては
OK でしょうが,意味分析としては,まだ完成しているわけではな
いし,コービルドのものが絶対的なものでもありませんでしょう.
統計分析も改良され,種類も増えてくることは確かで,将来は東海
林先生のおっしゃる通りでしょうが.

 私の考えているのは実はそのようなことではありません.専従
の1時間いくらで働くレキシコグラファーをどう養成するか,を
考えているわけです.その場合は時間との闘いになります.一般
語はもちろんですが,arrive, study, strange, clear, problem,
want, far ぐらいまでの基本語でしたら,概略書き上げてから
MI-score, T-score を見た方が効率がいいし,気が付くことも多
いと思いました.

 good とか have などの最重要語になると話は別になるでしょ
う.井上先生のご研究の many ぐらいになると単純頻度でできるか
自信はありません."Typical"という典型的な用例を抽出する方法も
あるそうですね.これは使いものになりますでしょうか.

 パソコンの能力の問題もあって,コービルドの大型コンピュー
タとパソコンでは分析の時間がまるで違いますので,へたに分析
するよりは KWIC で見た方が速いこともあるのではないではない
でしょうか.

5.1992年に私が行ったときは頻度ができたばかりで "Multicolm"
と呼ばれていましたが,別に "Multiconc" というプログラムがあっ
て,相当離れてあちこちにある solve+problem の頻度が出せまし
たが,複数もいっしょに出せるわけではないので,2つ求めてた
さなければなりませんでした.be + clear で be 動詞のすべてをた
して出してくれればいいのにと思いましたが,今では出ますで
しょうか.

(東海林先生への質問)新たに執筆者を開拓し,養成して,時間
単位で英和辞典を書いていく場合でも統計分析に頼る方がベター
だと思いますでしょうか.執筆者とパソコンの能力をも考えて.
(単純頻度の有効性は捨てがたいというのが私の意見です.)

くどくどと長く書きまして失礼しました.



From: "Hiroshi Shoji" <>
Subject: [lex] 自由連結の重要性 {02}
Date: Sun, 27 Dec 1998 17:34:37 -0000

東海林@バーミンガムです。

free combination / collocation について

1. this problem / this apple

南出先生はあくまでも一例としてこの両者を挙げられたのだと思いますが、現実
のデータでは絶対頻度数の点でも大きな差があります(The Bank of English,
full version)。
this problem: 2674例 / this apple: 17例
ちなみにproblem, appleそれぞれの1語前に共起している語のt-score上位10
語は次のようになります(problemの場合はt-score順と共起頻度順は一致してい
ますが、appleの場合は一致していません)。

<problemの-1語> <-1語の頻度><共起頻度> <t-score>
the 18107110 29507 143.167151
a 7197986 14712 105.186979
no 619659 3377 55.217943
this 1267790 2674 45.056767
real 92026 1166 33.415308
major 108885 960 30.030091
main 63668 908 29.559593
another 199372 917 28.495136
biggest 34742 824 28.376923
serious 46198 817 28.144554

<appleの-1語> <-1語の頻度><共起頻度> <t-score>
an 1050272 746 26.261146
big 127686 384 19.417680
the 18107110 1021 16.452093
and 7703837 483 12.388623
of 8419415 480 11.396918
with 2098293 185 9.381556
at 1691936 142 8.032519
crab 1396 58 7.610759
s 3182839 192 7.573112
<p> 5960027 277 6.847701

これらを見比べてみて言えそうなことは、

(1) problemの前では定冠詞の方、appleの前では不定冠詞の方が重要な結びつき
を示している。'the problem'はtext / discourseの中で重要な働きをしそうで
ある(→コンコーダンスでの検証が必要)。
(2) 'no problem'は独立した語義番号を与えて記述する価値がありそうである。
このうち'thanks'や'thank you'に対する返答として用いられているのはどの程
度の割合があるのか、興味深い(→コンコーダンスでの検証が必要)。
(3) 'this problem'に関しては南出先生の御指摘の通り。
(4) problemの直前語の上位10語のうち半数を占めているreal, major, main,
biggest, seriousが、村田先生のおっしゃるようにproblemの'core meaning'を
知る手がかりになりそうである。
(5) 'another problem'については'no problem'のように語義番号を与える価値
があるかどうかは疑問だが、text / discourseの中での働きを調べてみる価値が
ありそうである(→コンコーダンスでの検証が必要)。
(6) 'Big Apple', 'crab apple'についてはappleを第2要素に持つcompoundsの
中でも見出し語としての収録の必要度が高そうである。
(7) <p> (paragraph boundary) がappleの直前語の第10位に入っていて、
problemの場合に入っていないことは、それぞれの語のtextにおける位置付けの
違いを多少反映していそうである(→コンコーダンスでの検証が必要)。

などではないかと思います。
実際に辞書作成の準備段階としてproblemとappleを比較することはあまりないと
は思いますが、基本的な方法論の一例として書かせていただきました。

2. t-score / MI-score

(広義の)コロケーションの分析に統計分析が用いられるきっかけになった論文
は私の知る限り次のものです。

Church & Hanks (1990) 'Word association norms, mutual information, and
lexicography', Computational Linguistics, 16/1, 22-9.

この論文ではt-scoreについては軽く触れられているだけで、主としてMIによる
分析が扱われています。
次の論文では、t-scoreの扱いはより大きくなっています。

Church et al (1991) 'Using statistics in lexical analysis', in Zernik
(ed) Lexical Acquisition, Lawrence Erlbaum Associates, 115-65.

上記2つの研究を踏まえて、COBUILDのJeremy Clearの次の論文は、両者の統計
分析法をコーパスで実践し、それぞれの辞書編集への利用法を探っています

Clear (1993) 'From Firth Principles: Computational tools for the study
of collocation', in Baker et al (eds) Text and Technology, 271-292.

村田先生は次のように述べておられます:

> t-score は相対頻度ですから一応の完成を見ているのでしょうが,MI-score
> は意味の連想の強さを頻度計算式で表わしているわけですから,統計学と
> しては OK でしょうが,意味分析としては,まだ完成しているわけではない
> し,コービルドのものが絶対的なものでもありませんでしょう.

実はClear (1993) 自身が、辞書編集においてMIを主体的に用いることには警鐘
を鳴らしています。
この点私も自分のコーパス分析経験を踏まえ、村田先生・Clear (1993) と同意
見で、「統計分析をする場合にはまずt-scoreから」という立場です。
MIは決して不要というわけではないのですが、その利用法については今回のメー
ルの中心課題からは少し外れるので別の機会に譲ります。

長くなりましたので村田先生の御質問へのお答えは次のメールにさせていただき
たく存じます。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
Subject: [lex] 自由連結の重要性 {03}
Date: Mon, 28 Dec 1998 00:09:49 -0000

東海林@バーミンガムです。

free combination / collocation について
(前回のメールの続きです。)
(村田先生のメールから何回か引用させていただきますが、引用順序は元メール
とは異なっていることを御了承下さい。)

3. Why statistics? Why t-score?

村田先生は次のように述べていらっしゃいます:

> 新たに執筆者を開拓し,養成して,時間単位で英和辞典を書いていく場合で
> も統計分析に頼る方がベターだと思いますでしょうか.執筆者とパソコンの
> 能力をも考えて.(単純頻度の有効性は捨てがたいというのが私の意見で
す.)

「パソコン(自体)の(処理)能力」に関して言えば、全く問題ないと言えると
思います。
例えば前回のメールで私がお示ししたような共起語のデータは、私が自宅から電
話回線経由で(Internet Service Providerを通して)Bank of Englishにアクセ
スして得たものです。

コーパス利用の辞書編集の場合、次の3つの場合が考えられると思います。

(1) コーパスはホスト・コンピュータにあり、執筆者はネットワークを利用して
コーパスにアクセスし、データを得る。
(2) コーパス自体が執筆者のパソコン内にあり、執筆者はそこからデータを得
る。
(3) コーパスからデータを直接得るのは一部の執筆者だけで、残りの執筆者は出
力されたデータ(ディスク上のファイルまたはプリントアウトされた形)を受け
取って執筆を進める。

DVDのような大容量メディアが個人でも簡単に使える時代になると(2)の方法が主
流になるでしょうが、現状ではコーパスが小規模のものでない限りは(1)か(3)の
方法をとる必要があるでしょう。
理想的には、執筆者が全てコーパスに直接アクセスしてデータを得ることが望ま
しいと思います。
けれどもコーパス(処理プログラム)やパソコンが如何にuser-friendlyになろ
うとも、執筆者全員にそれを求めるのは酷であることは十分に承知しておりま
す。
したがって(3)が現実的な方法として浮かび上がってくるわけです。
そこで次の問題が生じてきます。

「コーパスの出力データとして何を執筆者に渡すべきか?」

村田先生のメールを拝見して、渡すべきものは「連結の単純頻度リストとKWICコ
ンコーダンス」であると先生は主張されていると理解致しました。
ここで後者のKWICコンコーダンスについては私も賛成です(「どの程度の分量
?」という問題に関する議論も必要ですが)。
連結の単純頻度リストの場合、もちろん頻度が大きい順に出力されてくるわけで
すが、「上位から数えてどこまで執筆者に渡すべきか?」という問題がありま
す。

(1) 全ての語について出力される全てのリストを渡す。
(2) 全ての語について例えば上位20語までのリストを渡す。
(3) 対象となる語のコーパスでの頻度にしたがって、渡すリストの長さも変え
る。

この3つが考えられるわけですが、私は(3)が一番望ましいのではないかと考え
ています。
コーパスでの頻度が高い対象語(基準語: node)ほど、辞書(特に学習辞典)で
割かれる分量も多くなるはずですから、その資料としては長いリストが有効であ
ろうと思うからです。
それではそのリストの長さをどのように決めるかという問題になります。
ここで統計、特にt-scoreが大きな意味を持ってくるわけです。
t-scoreというのは単純な結びつきの強さを示す尺度ではなく、基準語(node)
と別の語(collocate)が共起しているのが偶然のことではないとどの程度強く
主張できるかを示す尺度です。
前回挙げたChurch et al (1991) によると、tが1.65以上あれば95%の信頼度で
共起が偶然ではないと言えるとのことです。
この数値が一定の目安になり、客観的にリストの長さを決めることができるので
はないかというのが私の考え方です(現実にはt≧2.5あたりでも十分と感じてい
ます)。

辞書作成はチームワークです。
全員の執筆者が統計に関しても一定以上の知識を有していることが理想的である
とは思いますが、それが現実離れした考え方であることは十分に承知しておりま
す。
現実には一部の執筆者が上記のことを理解していて、残りの執筆者が「統計は絶
対頻度では不十分な点を補う手段である」という程度の知識を持っていれば、
「科学的な辞書編集」へ一歩近づくのではないでしょうか?

4. Bank of English today

>  パソコンの能力の問題もあって,コービルドの大型コンピュータとパソコ
> ンでは分析の時間がまるで違いますので,へたに分析するよりは KWIC で見
> た方が速いこともあるのではないではないでしょうか.

村田先生が滞在されていた当時と現在とでは事情が大きく異なっていると思いま
す。
確かにコーパス本体と分析プログラムはホスト・コンピュータに乗っています
が、ユーザーはネットワークによりクライアント(パソコン)を利用してコーパ
スにアクセスしています(COBUILDのlexicographerであろうとも)。
ホストとの物理的距離は処理速度にほとんど影響を与えないと思います。
それからKWICで見る場合に関して言えば、基本語の膨大なコンコーダンスを見る
のは共起語のリストを出力して見る場合よりもかえって時間がかかったりしま
す。
むしろ上記に述べた方法で出力した共起語リストを先に見てからコンコーダンス
を見た方が能率的であると言える場合もありそうに思います。

「英和辞典執筆」のことを村田先生は念頭に置いていらっしゃるのですから、上
記のお答えはちょっと的外れだったかもしれません。
けれども日本でも「英和辞典執筆」の基礎となる本格的なコーパスが利用できる
状況になれば(なって欲しいです!)、このお答えもあながちチンプンカンプン
のものではなくなるでしょう。

> 1992年に私が行ったときは頻度ができたばかりで "Multicolm"
> と呼ばれていましたが,別に "Multiconc" というプログラムがあって,相
> 当離れてあちこちにある solve+problem の頻度が出せましたが,複数もい
> っしょに出せるわけではないので,2つ求めてたさなければなりませんでし
> た.be + clear で be 動詞のすべてをたして出してくれればいいのにと思
> いましたが,今では出ますでしょうか.

現在のBank of English / CobuildDirectではある程度可能になっています。
solve@+0,1problem@ / be@+clear といった入力になります。

5. Concluding remarks

村田先生がfree combinationの意義を強調されたように、私も統計分析を強調し
た論調となりました。
「言語分析がそれほど機械的にできるわけがない。もっと人間的なアプローチが
必要だ。」といった反論が予想されます。
私は「統計分析は万能である」と主張するつもりはありません。
けれども、コーパスから得られるデータを辞書編集に「有効活用」するために
は、統計分析が必要であるということは強く感じています。
一見機械的で非人間的である「統計」が実は非常に人間的なデータを与えてくれ
ることが多いのをこちらへの滞在で実感しております。
「統計分析をしてそれで終わり」ではなく、そこからどのようにして学習者に役
立つ記述をしていくかという点に関しても十分に研究が必要と思っており、その
糸口としてsemantic prosodyやmetaphorの概念の有効性を今は考えております。

前回以上の長文になり、大変失礼致しました。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}
Date: Tue, 29 Dec 1998 01:17:22 +0900

      自由連結の重要性

村田 年(千葉大)です.
東海林先生,書込み2通いただきましてありがとうございます.こ
れについてはまた後で書かせていただきます.今回は前回長くなり
すぎて書かなかった点を書かせていただきます.2,3日前に
"Cornucopia" Winter 1999(桐原ユニ)をもらったんですが(これ
はいつ発刊された,どんな雑誌なのでしょうか?),その中の投野
由紀夫さんの文章を読み,意を強くしました.

1.英和辞典執筆のためのコーパスの大きさと質について

 東海林先生はコーパスの大きさにちょっと触れられましたが,私
はコーパスの扱いはあまりできないのですが,英和辞典執筆のため
のコーパスの大きさと質について,歩きながら,あるいは電車の中
で何度か考えました.

 1)最適なコーパスは現在1つもないのではないか?
 現在目にし,耳にするコーパスはすべてその資料が大人の英語に
偏っています.Timeなどの週刊誌,新聞,小説などが大きな部分を
占め,中学生から高校1年生の目線にあった資料の割合が低過ぎま
す.KWIC を見て,例文が50あっても1例も採用できないことなど
普通です.

 2)コーパスは大きければいいとは言えない.
 (内緒の話ですが)あるとき Bank of English の full version
(1994年当時のものか? theの頻度数から1億5千万から2億語ぐら
いのもの)の頻度上位 2000語を眺めるチャンスを与えられました.
手元の10ほどの基本語彙表をもって駆けつけ,突き合せてみて落胆
しました.10本の語彙表の中で,最も Written, bookish な部類に
は入り,COBUILD2 の星印の基本語の方がずっと高校生にとっていい,
という判断でした.(東海林先生,現行版の頻度上位 2000語を眺め
て下さいませんでしょうか.)
 コーパスを大きくするとどうしても Written, bookish, 古い,
硬い,ものになりがちでしょう.

 3)主見出し2万から8万語程度の高校生用英和辞典のためのコ
  ーパスは1つではどうしてもだめだと思います.
   1.1億語以上のコーパス
   2.2千万語のコーパス
   3.5百万語のコーパス
 この3種類ぐらいはほしいです.
 基準としては2の2千万語で辞書を執筆する.しかし,一般語の
記述の場合2千万語では出てこない,または頻度が 1-10程度のものが
かなりあるでしょう.そのようなときなど参照用として1億語以上
を用いる.2千万語はでき得る限り高校1,2年生の目線の言語資
料を食わせるようにし,高校生の英語力と資料があまりにもかけ離
れないようにする.Spoken の比率も高める.食わせる言語資料に
よって出てくる統計の数字も違ってくるわけです.
 例えば,study をいくつかのコーパスで見ると,資料が硬く,レ
ベルが高いと名詞の比率が高くなり,資料のレベルを落とし,口語
の割合を高めるにつれて今度は動詞の頻度が上がっていきます.で
すからコーパスによっては study は実は名詞としての比率の方が
ずっと高いんだ,という判断になってしまいます.このようなこと
はあらゆる面で出てきて,記述を狂わせるでしょう.
 重要基本語ほど中学生,高校生の日常に合った用例をあげ,彼ら
のコミュニケーションに合った語義・用法の記述をしなければなり
ません.このため重要基本語執筆用の500万語こそ Written も
Spoken も高校生の目線に合ったものにし,Spoken の比率をできる
だけ,例えば40%ぐらいに高めるわけです.
 従来の Spoken の資料は大人の会話が多く,高校生の会話の内容
は少ないようです.

 このように見てくると信頼できるコーパスはまだ世の中に存在し
ていません.(鷹家秀史・須賀 廣両先生の新刊書『実践コーパス
言語学 ― 英語教師のインターネット活用』(桐原ユニ)には多く
のコーパスが紹介され,また自分でも簡単に作れます,といって作
り方も教えてくれていますが,これが辞書を書くためのコーパスと
なると簡単にはいきません.この著書はたいへんに具体的で,やさ
しくて,私のようにインターネットの世界にほとんど入っていない
者でも理解でき,明日から使えそうな気分になります.どなたかこ
のMLでも紹介していただけないでしょうか.)

 「まだ世の中に存在していません」と強く書いたのは(もっと弱
く書こうと思っていたのですが)投野先生の文章を昨日発見したか
らです.

「1つは現在のコーパスのほとんどが教育目的に作られていないと
いうことである.大学レベルの言語学の授業だからまだしも,実際
の初級・中級学習者に対してのコーパス利用は,コーパスの中身を
どういうものにするかという十分な議論がなければとても成功する
とは思えない.」 --Cornucopia Winter 1999, p.8

「@教育用途に特化したコーパスの必要性
 現在のコーパスは,ほとんどが教育目的で収集されているもので
はない.COBUILDが生きた英語ということで話題をさらったが,結
局例文は難解で学習用には無理があった.コーパスもまったく同様
の問題をはらんでいる.学習者のニーズにチューニングされたコー
パスの登場が待たれる.」 --同書 p.12

私は現在ほとんど予算のない部局にいるため,公費で COBUILDdirect
が使えないので,使っていません.このコーパスも同様ですから,
この結果で英和辞典の記述をコメントするときは慎重でなければな
らないでしょう.先程 study の例をあげたように.

 このような視点で英英辞典を見ると,LDOCE3を初め4強のすべては
日本の高校生の目線には合っていません.その student 版も同様です.
この点反論を期待しております.

長くなりました.このへんで.



From: kazuo kato <>
Subject: [lex] 自由連結の重要性 {02}
Date: Tue, 29 Dec 1998 10:39:32 +0900

加藤@岩手医大です.

村田先生の尻馬に乗って(?)書かせていただきます.

私自身は corpus/corpora については素人で,coprpus linguistics もほとん
ど勉強しておりません.ただ,corpus の "representativeness"(「代表性」
という訳語が斎藤・中村・赤野(編)『英語コーパス言語学:基礎と実践』(研
究社,1998),p.18 にありますので,それを使わせてもらいます)について少
し前から気になっていたことがあります.

村田 年 wrote:

>  1)最適なコーパスは現在1つもないのではないか?
>  現在目にし,耳にするコーパスはすべてその資料が大人の英語に
> 偏っています.Timeなどの週刊誌,新聞,小説などが大きな部分を
> 占め,中学生から高校1年生の目線にあった資料の割合が低過ぎま
> す.KWIC を見て,例文が50あっても1例も採用できないことなど
> 普通です.
>
>  2)コーパスは大きければいいとは言えない.
(引用略)

この ML の投稿を見ていると,B'ham で勉強された方が多く,CobuildDIRECT
がよく引用されますので,The Bank of English のコーパスが最上であるよう
な印象を持っていたので,村田先生の上の文章を拝見して,「あれ?」と思う
と同時に,やっぱりそうかという感じもしました.
しかし,村田先生が問題にされているのは日本の高校生用のコーパスのこと
であって,一般向けのコーパスではありません.私の疑問の第一は,

一般用のコーパスについても「最適なコーパスは現在1つもないのではない
か?」と言えるのか,ということです.

この疑問の「系」になると思いますが,疑問の第2は,

コーパスの優劣を評価する客観的な基準があるか,ということです.

疑問の第3は,

「コーパスは大きければいいとは言えない」のかという問題です.

周知のように,個々の基本語彙ならともかく,連語(これには「自由連結」と
collocation の両方を含めることにします)の用例を調べようとすると,BNC
などでは生起率が極めて低く,同種の連語と比較しようとしても,例数が少な
すぎて,あまり役に立たないのが普通です.そのような時に時々利用している
のが勤務先の図書館からアクセスできる DIALOG の米国の新聞のデータベース
です.しかし,これは新聞ですから「代表性」には問題があるでしょう.
また,Infoseek なども利用していますが,これは anarchy の象徴みたいな
世界ですから,「代表性」など問題にすること自体が問題です.

前置きが長くなってしまいましたが,少し前に Kenneth W. Church and
Robert L. Mercer (1993), "Introduction to the special issue on computa-
tional linguistics using large corpora," Computational Linguistics 19
(1): 1-24 という論文を読みました.その中に "Should a Corpus be Bal-
anced?"(pp.17-19) という節があります.一部引用します:

Ideally, we would like to use a large and representative sample of
general language, but if we have to choose between large and repre-
sentative, which is more important? There was a debate on a similar
question between Prof. John Sinclair and Sor Randolph Quirk at the
1991 lexicography conference sponsored by Oxford University Press and
Waterloo University, where the house voted, perhaps surprisingly,
that a corpus does not need to be balanced.... Thus, it would appear
that "more data are better data," at least for the purpose of finding
examples of words like IMAGINABLE.

上の省略した個所には Sinclair が balanced corpus 構築の難しさを説いたと
あります.そこでお伺いしたいのですが Church and Mercer が述べているよう
な状況は今も変わっていないのかということです.

このほか,lexicography as a science と practical (and commercial)
lexicography についても発言したい気持ちもありますが,今はその余裕があり
ません.



From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}
Date: Wed, 30 Dec 1998 00:24:12 +0900

    コーパスで学習英和を作る

村田 年(千葉大)です.
 東海林先生の書込みを読んできてに私とそれほど大きく考えが異な
るわけではないと思いました.違いは私は学習英和,それも中辞典の
小さめのものまで,具体的には『ジーニアス英和』ぐらいまでで,
『プログレッシブ英和』ぐらいから上には関心の重点がないこと.具
体的に学習英和をどう作っていくかで,コーパスの作成(または借用),
執筆の陣容(専従のレキシコグラファーと英語教員),執筆者のトレ
ーニング,執筆者とコーパスとの関係,パソコンの用意,収録語彙と
コーパスとの関係,編集委員の仕事,編集部員と予算など,など,を
1992年にコービルドへの短期研修から帰ってから,ときどき考えては
出版社にも話してきました.そんなわけで視点が具体的で,低いわけ
です.

1.problem の<共起頻度>と <t-score>, apple の <共起頻度> と<t-score>

 problem の場合は先生も言われているように,共起頻度から t-score
が予想できるわけです.一般的に t-scoreのおおまかな予想(この連
結よりこちらの方が高いだろうといった)はかなりできるのではないで
しょうか.2,3ヶ月執筆を続けていきますと自分のコーパスでの機能
語の生起頻度の大体の順番が頭に入ってきますので.

 一般的には apple のように t-score はあまり意味のない連結が並び
ます.これの解釈で時間を取ったり,頭が混乱したりしないためには,
まず KWIC と共起頻度で概略を書いてみる方がいい,これが少しばかり
の経験に基づく私の意見です.
 big と crab が強い連結があるのは共起頻度だけでもわかります.
t-score に慣れるまでは直接 crab の頻度を求めて判断した方が実感で
きるのです.

 
<実はClear (1993) 自身が、辞書編集においてMIを主体的に用いることには警鐘
<を鳴らしています。
<この点私も自分のコーパス分析経験を踏まえ、村田先生・Clear (1993) と同意
<見で、「統計分析をするときはまず t-score から」という立場です.
<MIは決して不要というわけではないのですが、その利用法については今回のメー
<ルの中心課題からは少し外れるので別の機会に譲ります。

東海林先生,この点について自分の発言を反省しています.簡単に引き
下がらないでいただきたかったですね.機能的・文法的なコロケーショ
ンに焦点をあてた t-score は私にも曲がりなりですが理解でき,かなり
予測もできます.が,MI-score は理解が今ひとつであり,これはいい
という実感を自分の執筆ではまだ得ていません.しかし,あらゆる意味
的なコロケーションに焦点があると聞くと極めて魅力的です.井上永幸
先生をはじめ何人かの論文で目のさめるような発見に出会い,これはす
ごい,と一方では思っているわけです.

<「パソコン(自体)の(処理)能力」に関して言えば、全く問題ないと言えると
<思います。
<例えば前回のメールで私がお示ししたような共起語のデータは、私が自宅から電
<話回線経由で(Internet Service Providerを通して)Bank of Englishにアクセ
<スして得たものです。

私が申しているのはパソコン内にコーパスがある場合の統計処理や連結
の求め方の時間を言っているのです.

<コーパス利用の辞書編集の場合、次の3つの場合が考えられると思います。
<
<(1) コーパスはホスト・コンピュータにあり、執筆者はネットワークを利用して
<コーパスにアクセスし、データを得る。
<(2) コーパス自体が執筆者のパソコン内にあり、執筆者はそこからデータを得
<る。
<(3) コーパスからデータを直接得るのは一部の執筆者だけで、残りの執筆者は出
<力されたデータ(ディスク上のファイルまたはプリントアウトされた形)を受け
<取って執筆を進める。

この3つはいずれの場合も問題がいろいろとあると思います.私の個
人的な意見としては(2)が一番いいと思っています.(3)の場合
は残りの執筆者(これが英語の教師である場合)から必ず不満が出る
でしょう.教師は執筆しながら勉強もしたいと思っていますので.
(1)も電話回線をつないだままにしてもおけないし,問題がありま
す.今やっているみなさんは研究ですからやれるのだと思っています.

<村田先生のメールを拝見して、渡すべきものは「連結の単純頻度リストとKWICコ
<ンコーダンス」であると先生は主張されていると理解致しました。

実は違うのです.私の議論はすべて自宅のパソコンにコーパスがあるこ
とを前提にしています.ですから見たければいつでも t-score も
MI-score も見られるのであるが,後者は2次資料としてあまり最初か
ら見ない方がいいと自分の経験上言っているわけです.

<(1) 全ての語について出力される全てのリストを渡す。
<(2) 全ての語について例えば上位20語までのリストを渡す。
<(3) 対象となる語のコーパスでの頻度にしたがって、渡すリストの長さも変え
<る。
<
<この3つが考えられるわけですが、私は(3)が一番望ましいのではないかと考え
<ています。

この点はおっしゃる通りだと思います.(3)に「語によって t, MI
を加える」とした方がいいでしょう.

<現実には一部の執筆者が上記のことを理解していて、残りの執筆者が「統計は絶
<対頻度では不十分な点を補う手段である」という程度の知識を持っていれば、
<「科学的な辞書編集」へ一歩近づくのではないでしょうか?

おっしゃる通りだと思います.

<4. Bank of English today

お教えいただきましてありがとうございました.

<「英和辞典執筆」のことを村田先生は念頭に置いていらっしゃるのですから、上
<記のお答えはちょっと的外れだったかもしれません。
<けれども日本でも「英和辞典執筆」の基礎となる本格的なコーパスが利用できる
<状況になれば(なって欲しいです!)、このお答えもあながちチンプンカンプン
<のものではなくなるでしょう。

私の方がやや初級の英和辞典という視点でこちこちになっていますが,
先生のお考えはほとんど理解できるし,だいたいは賛成できると思いま
した.
私はもう年で,時間がありませんので,早くコーパスに基づく英和辞典
が見たいですね.投野先生が秘密がまったくなくて何でも発表してしま
うイギリスの辞書界を半ばあきれて紹介していますが,日本ももう少し
社内秘をへらして各社が協力する体制にすべきです.現状では辞書その
ものが見放されかねません.大修館の飯塚さんをはじめ各出版社の方の
最近の書き込みに少し期待が持ち始めております.

コーパスに詳しい方の書き込みを期待しているのですが,机上の空論で
相手にしにくいとお考えでしょうか.

いつも長くて申し訳ございません.



From: Nagayuki Inoue <>
Subject: [lex] 自由連結の重要性 {01}{01}
Date: Wed, 30 Dec 1998 06:05:26 +0900

村田先生,東海林先生

コーパスと辞書編集の議論,興味深く拝見しております。このままコーパスに基
づく辞書ができるのではないかというくらい,議論が具体的ですね。(^_^;)

先生方と同じく,コーパスに基づく辞書編集に興味を持つ者として,少しだけ感
想を書きます。

いろいろな統計数値〔t-score,MI-score,c-scoreなど〕があって,それぞれに
長所短所があると思います。特に,MI-scoreなどは,東海林先生がおっしゃるよ
うに批判する意見もあるようです。〔cf. Baugh, S., A. Harley and S. Jellis
(1996) "The Role of Corpora in Compiling the Cambridge International
Dictionary of English." International Journal of Corpus Linguistics 1:1,
pp. 39-59〕

こういった統計数値はしょせん確率の問題ですので〔たとえはあまりよくないで
すが,%表示による天気予報のようなもの〕,リストの上位にあがっているもの
でも,偶然リストの上に上がってきているものもあり,結局は利用者が KWICと見
比べながらその数値の意味を再確認する必要があるわけです。一方,何万何千行
というKWICを見てアイディアをひねり出すより,一目で問題のキーワードの注目
すべき現象を把握することができることもあるわけです。

すでに東海林先生も詳しく書かれていますが,MI-scoreは特に,キーワードの周
辺に生起する特徴的な語〔期待値よりも実験値の高い語〕がリストの上位にあが
ってきますので,サンプルのテクストに偶然扱われていたテーマや固有名詞がリ
ストの上位にあがってくる可能性が高くなります。したがって,本当の意味でキー
ワードと連語関係にないものもリスト上位にあがってくることになりますが,こ
ういったものは常識的判断や, KWICを検証することによって排除することができ
ます。そのような癖さえ知っていれば,ないよりはあった方が断然いいですね。
                                (^_^)

私は,こういった統計的数値にしても,コーパスにしても,要は使い方次第だと
思います。信頼できない場合は,使わなければ〔あるいは採用しなければ〕いい
だけです。目的によってコーパスの構成も変わってきて当然ですし,用いる統計
的数値も変わってくるでしょう。用途にあったものを,適切に使ってこそ,真価
を発揮できるのではないかと思います。

以上,まとまりませんが,意見を書かせていただきました。

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}{01}{01}
Date: Thu, 31 Dec 1998 00:09:48 +0900

井 上 永 幸 先生

村田 年(千葉大)です.

書き込みありがとうございます.
使えるものは使ってあとはその人の判断だ,というご意見はその通りです.
先生の論文でいつも勉強させていただいております.理解が遅くて,きつい
ことではありますが.

加藤先生のご質問にお答えいただけるとありがたいですね.



From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}
Date: Thu, 31 Dec 1998 00:10:08 +0900

加藤和男先生

村田 年(千葉大)です.
「知ったか」を決め込んで,だぼらを吹いているようなものです.
加藤先生ご自身がもう答えをご用意なさっていらっしゃるのではとも
思いますが,コーパスに強い方の発言を期待したいですね.

< 一般用のコーパスについても「最適なコーパスは現在1つもないのではない
< か?」と言えるのか,ということです.

私の場合外国語としての(第2言語としての場合は少し違ってくるで
しょう)英語学習のため,それも初級学習辞典を作るための,といっ
た条件で発言しているだけですので,答える資格はありません.自分
の感じとしては,一般用コーパスはいろいろなものがあった方がいい
と思っております.

<疑問の第2は,
<コーパスの優劣を評価する客観的な基準があるか,ということです.

英和辞典用のコーパスとしては自分なりの基準は頭の中に描いている
ので,だれかが提案なされば議論はできると思っています.客観的な
基準と言えるほどのものではないですが.

疑問の第3は,
「コーパスは大きければいいとは言えない」のかという問題です.

同質のものであれば大きいほどいいと思います.しかし現実にはそれは
無理でしょう.そこでやや小さくして質の面で要求に合わせるわけです.
BNC でも間に合わないという加藤先生の利用例は私の頭の中の想像を超
えています.

私の見たコービルドのコーパス群はかなり雑ぱくなものでした.打ち
込みミスや読み込みミスは有効な誤差の内でした.まったく同じ用例
が7つあるぐらいはめずらしいことではありませんでした.同じ文が
12例出たこともありました.主に私が使った Corpus Twenty は精選
された現代英語 2000万語との説明でしたが,同じ文が7例というのは
ときどきありました.これは主に BBC で同じニュースが何度も放送さ
れて,それを全部取り込んで,あとで修正がなされない,といったも
ののようでした.このようにコービルドはコーパスを大きくするため
にかなりのものを犠牲にしている印象を受けました.

しかし,ロンドン大学の Surveyの小さなコーパスを使ったとき,大き
いことはいいことだと,コービルドのコーパスをありがたく思い出し
ました.

先生の「一般用」という範疇では大きいことは最も優れた条件の1つ
でしょう.

お答えする資格のない者からの感想です.書き込みありがとうござい
ました.



From: Nagayuki Inoue <>
Subject: [lex] 自由連結の重要性 {01}{02}
Date: Thu, 31 Dec 1998 08:04:33 +0900

加藤先生

井上(島根大学)です。いつも貴重な情報をありがとうございます。私なんかよ
りも,投野先生や東海林先生といった,現在最前線をご研究されている先生方が
いらっしゃいますので,そういった先生方のご意見をうかがえればと思っていた
ところですが,村田先生のお言葉ですので,少しだけ個人的な意見を書かせてい
ただきます。帰省で尾道の実家におりますので,手元に資料もなく,正確さに欠
けるかもしれませんがお許しください。

> しかし,村田先生が問題にされているのは日本の高校生用のコーパスのこと
> であって,一般向けのコーパスではありません.私の疑問の第一は,
>
> 一般用のコーパスについても「最適なコーパスは現在1つもないのではない
> か?」と言えるのか,ということです.

「一般用のコーパスについても『最適』…」の定義といいますか,考え方にもよ
るでしょうが,つまりすべての用途に適したコーパスといった意味であれば,な
いでしょうね。というか,そのようなコーパスを作ること自体,不可能かもしれ
ません。

「一般用」というのを「英米の英語を誰彼なしに利用する」というふうにおおざ
っぱにとらえたとしても,既成のコーパスでは「米」の部分が決定的に不足して
いますね。

また,日本人のための辞書づくりに使うのであれば,それ相当の工夫が必要
でしょうし,ターゲットユーザーが誰かによっても,コーパスの構成を変える必
要がでてくるわけですから。

いずれにしても「最適」かどうかを決めるのは,どういった目的に使うかを決め
た後だと思います。

The Bank of Englishが最上のものであるような印象を受けられたということです
が,個人的な事情で申し上げますと,現在日本から利用できるコーパスで(私に
とって)もっとも充実したサービスが受けられるという理由から使っているもの
です。いろいろ不満はあるでしょうが,これほどの規模で,これほど寛容なサー
ビスを提供してくれるコーパスは現在ほかにないと思います。〔投野先生,東海
林先生いかがでしょうか(^_^;)〕

> この疑問の「系」になると思いますが,疑問の第2は,
>
> コーパスの優劣を評価する客観的な基準があるか,ということです.

Atkins, Clear & Ostler (1992) でしたか,corpus designについて書いていたと
思います。

ただ,何度も申しますように,目的ごとにコーパスの構築方針は異なるでしょう
から,そういった意味では,その目的の数だけ,基準もあるべきだと思います。

※Atkins, S., J. Clear & N. Ostler (1992) "Corpus Design Criteria," in
Literary and Linguistic Computing, Vol. 7, No. 1, pp. 1-16.

> 疑問の第3は,
>
> 「コーパスは大きければいいとは言えない」のかという問題です.

まずは一般論として,大きければその方がデータの客観性は高くなると思います。
ただ,実際に辞書の資料としてデータを扱う立場で言うと,たとえば,基本語な
どを検索する場合などは,小規模な方が扱いやすいかもしれません。ただ,これ
も,抽出したデータをどう使うかによると思います。1例ずつ見てゆくために使
うのか,統計値をとりたいのか,ざっとした傾向を知りたいのか,などですね。

ある一定の基準でもってバランスのとれた中・小規模のコーパスができあがった
として,imaginableのような頻度がそれほど高くない単語を検索したときに,辞
書の項目が書けるほど十分な数の用例がでてこないこともあるかと思います。そ
ういった単語を拾うべく,規模を一定に保つのではなくどんどん蓄えていって,
とにかくできるだけ大きなコーパスをつくってゆくというのがモニターコーパス
と呼ばれるものですね。Bank of Englishなどはその例です。

> 上の省略した個所には Sinclair が balanced corpus 構築の難しさを説いたと
> あります.そこでお伺いしたいのですが Church and Mercer が述べているよう
> な状況は今も変わっていないのかということです.

基本的には変わっていないように思います。用例をとにかく見たいのであれば,
コーパスサイズが大きい方がいいでしょうね。

思うままに書きましたが,他の先生方による書き込みもお待ちしております。異
論・反論宜しくお願い申し上げます。

> このほか,lexicography as a science と practical (and commercial)
> lexicography についても発言したい気持ちもありますが,今はその余裕があり
> ません.

加藤先生の書き込みを楽しみにしております。

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {01}
Date: Thu, 31 Dec 1998 01:21:31 -0000

東海林@バーミンガムです。

所用で留守にしている間に、議論が盛り上がっており、帰宅して諸先生方のメッ
セージをワクワクしながら読ませていただきました。

まずは村田先生のTue, 29 Dec 1998 01:17:22 +0900のメールに関して:

> 1.英和辞典執筆のためのコーパスの大きさと質について

>  1)最適なコーパスは現在1つもないのではないか?

中学・高校生向けの英和辞典の資料としては、おっしゃる通りかもしれません。
特に現行のコーパスに忠実に、誠実に辞書を作ると、どうしてもハイレベルのも
のになってしまうでしょう。
逆に言えば大学生・社会人に思い切りターゲットを絞った辞書であれば、現行
の、もしくは現行と同じような構成のコーパスで、素晴らしい英和辞典ができる
可能性があると思います。
今年出たNODEのコンセプトで「大人向け」英和辞典を作るとなかなか面白いもの
ができるのではないでしょうか?

>  2)コーパスは大きければいいとは言えない.

これは「大きくし方」によるのではないでしょうか?
確かにBank of Englishの「大きくし方」は「大人志向」です。
特にジャーナリズムの英語が増えていく傾向があるように思います。
ただ、村田先生は「コーパスを大きくするとどうしても Written, bookish, 古
い,硬い,ものになりがちでしょう」とおっしゃっておられますが、このうちの
「古い」に関しては、少なくともBank of Englishには当てはまらないように思
います。

「学習辞典作り」を念頭に置いた「大きくし方」であれば、「コーパスは大きけ
れば大きいほどいいと言える」というのが私の考え方です。

付け加えますと、(広義の)コロケーションの統計的研究で、CobuildDirect
(50 million) とBank of English (320 million) の両方による分析を経験しま
したが、明らかに後者の方が精密なデータを取れます。

>  3)主見出し2万から8万語程度の高校生用英和辞典のためのコ
>   ーパスは1つではどうしてもだめだと思います.
>    1.1億語以上のコーパス
>    2.2千万語のコーパス
>    3.5百万語のコーパス
>  この3種類ぐらいはほしいです.

2)の場合と関連しますが、適切な設計により作られた巨大コーパス(大きけれ
ば大きいほど良い)があれば、複数のコーパスの必要性は下がるのではないで
しょうか?
基本語のコンコーダンスが見通し切れないという問題点は、適切なるサンプリン
グ法が解決してくれます。

>  重要基本語ほど中学生,高校生の日常に合った用例をあげ,彼らのコミュ
> ニケーションに合った語義・用法の記述をしなければなりません.このため
> 重要基本語執筆用の500万語こそ Written も Spoken も高校生の目線に
> 合ったものにし,Spoken の比率をできるだけ,例えば40%ぐらいに高め
> るわけです.

Spokenの比率を高める必要性に関しては全く同感です。
今までこのリストでも書いてきましたが、here you go, hiyaなど、口語では
「普通に出会う」表現が学習辞典で十分に扱われていないことが多いのは、やは
りコーパスがWrittenに偏っているからでしょう。

>  このように見てくると信頼できるコーパスはまだ世の中に存在していませ
> ん.(鷹家秀史・須賀 廣両先生の新刊書『実践コーパス言語学 ― 英語教
> 師のインターネット活用』(桐原ユニ)には多くのコーパスが紹介され,ま
> た自分でも簡単に作れます,といって作り方も教えてくれていますが,これ
> が辞書を書くためのコーパスとなると簡単にはいきません.

御紹介されている著作が入手困難なため、慎重にコメントしなければと思います
が、村田先生の「簡単にはいきません」というお言葉には大変重みがあると思い
ます。
私はその一番の難しさは「著作権」にあると思います。
これは個人の力ではどうしようもありません。
COBUILDのコーパスがなぜ素晴らしいのか、その理由の一つはこの問題に当初か
ら真剣に取り組み、きちんとクリアしていったことにあります(Sinclair ed.
1987 Looking Up参照)。
British National CorpusはCollins社とBirmingham大学がこの問題をクリアして
大きなコーパスを作ってしまったことに脅威をなして作られた「COBUILD包囲
網」であると私は考えています(価値判断ではありません)。
「個人のコーパス」は(狭い意味で)「研究用・教育用」の域を越えるものでは
ありません(超えてはならないのです)。

投野さんの文章より:

> 「1つは現在のコーパスのほとんどが教育目的に作られていないということ
> である.大学レベルの言語学の授業だからまだしも,実際の初級・中級学習
> 者に対してのコーパス利用は,コーパスの中身をどういうものにするかとい
> う十分な議論がなければとても成功するとは思えない.」 --Cornucopia
> Winter 1999, p.8

> 「@教育用途に特化したコーパスの必要性
>  現在のコーパスは,ほとんどが教育目的で収集されているものではない.
> COBUILDが生きた英語ということで話題をさらったが,結局例文は難解で学
> 習用には無理があった.コーパスもまったく同様の問題をはらんでいる.学
> 習者のニーズにチューニングされたコーパスの登場が待たれる.」 --同書
> p.12

TALC98 (Oxford) で御本人にお会いしてお話させていただいたことを思い出しま
す。
TALCとは、Teaching And Language Corporaの略で、教育面が前面に出されてい
る会議だったのですが、発表内容の中には現行のコーパスに対してあまりにも
optimisticで、「そのまま学習者がアクセスして利用できる」というものがあっ
たりしたことには私も疑問を感じました。

現行のコーパスはごつごつした岩のようなもので、それをきちんと削らなければ
学習者に「直接」役立つ情報は得られないというのが率直なところです。
この「削り役」(コーパスと学生・生徒との仲介役)が教師・研究者・編集者・
レキシコグラファーなのでしょう。
コーパス自体を岩ではなく丸い石にしていく方向性がいいのか、コーパスは岩を
残してそれに小石を混ぜるようにして、「削り方」を洗練させていく方向性がい
いのかは諸先生方の御意見を伺いたいと思います(私自身はどちらが望ましい方
向性なのかについてはまだ自分の見解が確立していません。今は「削り方」の修
行をしているつもりですが…)。

村田先生:

>  このような視点で英英辞典を見ると,LDOCE3を初め4強のすべては日本
> の高校生の目線には合っていません.その student 版も同様です.
> この点反論を期待しております.

前半は全く同感です。
後半は必ずしもそうとは言えないと思います。
例えば以前話題にしたLongman Active 3は、重要語の差別化をするなど対象学習
者を念頭に置いた改善を心がけていると思います(完全に成功しているかどうか
は別として)。

例によって長くなりました。
けれども議論自体は大変有意義なものと感じておりますので、どうぞお許しを。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 赤野 一郎 <>
Subject: [lex] {01}自由連結の重要性 {02}
Date: Thu, 31 Dec 1998 10:30:00 +0900

赤野@京都外大です.

加藤先生のこの疑問に限って、私の意見を述べさせていただきます.
> 「コーパスは大きければいいとは言えない」のかという問題です.

文体論研究やレジスター間の相違を調べるには、バランスのとれたコーパスが必
須ですが、語彙の連語関係の研究に限っていえば、「大きければいい」と言える
と思います.

井上先生がおっしゃっているように「基本語などを検索する場合などは,小規模
な方が扱いやすい」と思いますが、頻度の低い語を1千万語のコーパスで検索し
た場合と、1億語のコーパスで検索した場合を比較すると、その結果はかなり違
ってきます.1億語のコーパスで検索するのは、あたかも拡大鏡で観察しているよ
うな感じです.1千万語でははっきりしなかった規則的パターンが1億語では鮮明
に見えてくることがよくあります.KWIC形式での検索結果を検索対象語の左右でい
ろいろソートしてみると、特にこのことがわかります.

その意味で、村田先生が言われていたように、辞書執筆の基礎データとして、ま
ず純粋頻度とKWICデータを重視します.

__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/
AKANO, Ichiro
Kyoto University of Foreign Studies
TEL: 075-322-6103
E-MAIL:
英語語法文法学会: http://member.nifty.ne.jp/usage_grammar
__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/__/



From: Nagayuki Inoue <>
Subject: [lex] 自由連結の重要性 {01}{01}
Date: Thu, 31 Dec 1998 13:09:39 +0900

井上(島根大学)です。

村田先生が以下のように書かれています。

> ていません.(鷹家秀史・須賀 廣両先生の新刊書『実践コーパス
> 言語学 ― 英語教師のインターネット活用』(桐原ユニ)には多く
> のコーパスが紹介され,また自分でも簡単に作れます,といって作
> り方も教えてくれていますが,これが辞書を書くためのコーパスと
> なると簡単にはいきません.この著書はたいへんに具体的で,やさ
> しくて,私のようにインターネットの世界にほとんど入っていない
> 者でも理解でき,明日から使えそうな気分になります.どなたかこ
> のMLでも紹介していただけないでしょうか.)

このMLには,確かこの本のご著者の鷹家・須賀両先生も参加されていると思い
ますので,是非この本の,コンセプトといいますか,ねらいをこのMLに参加さ
れている方々のためにご紹介いただければ幸いです。<m()m>

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: "Matumoto Yosihito" <>
Subject: [lex] RE: [lex] 自由連結の重要性 {01} {01}
Date: Thu, 31 Dec 1998 14:01:08 +0900

佐賀の松本@コーパス初心者です。

東海林先生
><(1) コーパスはホスト・コンピュータにあり、執筆者はネットワークを
><利用してコーパスにアクセスし、データを得る。

来年(といっても明日からですね),佐賀でインターネット無料接続サービス(県の
実験です)が始まるのですが,コーパスをクライアントから操作するにはどうすれば
よいのでしょうか。現在,MicroConcord を利用していますが,そういった既存のソ
フトを利用できるのであれば,ぜひ県に提案してみたいと思っています。

初歩的な質問で申し訳ありませんが,よろしくご教示お願いいたします。



From: "Hiroshi Suga" <>
Subject: [lex] RE: [lex] 自由連結の重要性 {01}{01} {01}
Date: Thu, 31 Dec 1998 14:26:07 +0900

倉敷天城高校の須賀です。井上先生,拙著紹介のおすすめ
いただきありがとうございました。このMLにはコーパスに詳し
い方々がたくさんおられますので気恥ずかしくて沈黙していま
した。 (^^ゞ

鷹家先生がたぶん帰省されておられると思いますので私から
少し「実践コーパス言語学」(桐原ユニ)の紹介をさせていただ
きます。すでに研究社から「英語コーパス言語学」が出版され
ておりますが,この本は実はそれを知らずに企画が進んでい
たものです。だから,研究社の本が出た時はあ然として血の
気が引きました(^_^;)  しかし,素人が書いたものだからかえ
っておもしろいのではというアドバイスもあり,気を取りなおして
かなり内容を書きかえてできたものです。

まだコーパスを知らない現場の教師が見て参考になるように
と思って書いたものですから,コーパスについて詳しい先生
にはあまり参考にはならないと思います。
高校の教育現場ではまだコーパスの認知度が低く,この本が
少しでも役に立ってくれれば(そして多少でも売れてくれれば)
と願っております。目次など詳しくは下記にあります私のHP
をのぞいていただければと存じます。m(_ _)m

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"
倉敷天城高等学校   須 賀  廣
email  : 
Home Page :  http://www1.harenet.ne.jp/~suga

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {02}
Date: Thu, 31 Dec 1998 10:19:43 -0000

再び東海林@バーミンガムです。

加藤先生のメールTue, 29 Dec 1998 10:39:32 +0900に対して:

> この ML の投稿を見ていると,B'ham で勉強された方が多く,CobuildDIRECT
> がよく引用されますので,The Bank of English のコーパスが最上である
> ような印象を持っていたので,村田先生の上の文章を拝見して,「あれ?」
> と思うと同時に,やっぱりそうかという感じもしました.

この点に関しましては既に井上先生が次のように書かれておられます:

> The Bank of Englishが最上のものであるような印象を受けられたというこ
> とです
> が,個人的な事情で申し上げますと,現在日本から利用できるコーパスで
> (私にとって)もっとも充実したサービスが受けられるという理由から使っ
> ているものです。いろいろ不満はあるでしょうが,これほどの規模で,これ
> ほど寛容なサービスを提供してくれるコーパスは現在ほかにないと思います。
> 〔投野先生,東海林先生いかがでしょうか(^_^;)〕

「充実したサービス」、「規模」、「寛容なサービス」、まさにおっしゃる通り
だと思います(現在私は特に恵まれた状況におりますが、この状況を離れた場
合、CobuildDirectは料金が高いと感じるだろうとは思います)。

British National Corpus (BNC) vs. Bank of English (BOE)

<BNCの○>
@WebやSARAでの利用は(一応)Graphical User Interfaceであるため、コマン
ド・ベースのBOEと比べて特に初心者にはとっつき易い(敷居が低い)。
@村田先生が書かれておられるようなBOEに存在する不要な重複はおそらく存在
しない(と思われる)。
@解説書がおそらくBham大内部用、あるいはftpにあるダウンロード用しか存在
しないBOEに対して、BNC HandbookはEdinburgh University Pressより市販され
ている。

<BOEの○>
@とにかく規模が(full versionで)BNCの3倍以上と巨大。現在でも少しずつ
増幅している。
@(広義の)コロケーション分析をあらかじめ想定した設計になっている(BNC
では不可能ではないが大変時間がかかる)。
@文字通りBritishのBNCに対して、(少ないながらも)北米・オーストラリアの
英語が収録されている。

私の使用経験からはざっとこんなところかと思います。

再び加藤先生:

> 一般用のコーパスについても「最適なコーパスは現在1つもないのではない
> か?」と言えるのか

私個人は「自分の研究」目的にはBOEが(現存するコーパスの中では)「最適に
近い」と思っていますが、これは目的が変われば「最適」も変わってくるでしょ
う(井上先生と同意見です)。

> コーパスの優劣を評価する客観的な基準があるか

これも人によって(客観を装おうとも)基準が異なるようで、特にある特定の
コーパスに関わるとどうしてもそれを贔屓目に言ってしまう傾向があるようです
(私もその一人であることは否定できそうもありません(^_^;))。
上に書いた2つのコーパスの対比は客観的に示そうと心がけたつもりですが、私
はBOEを使い込んだ経験から、特にBOEの2番目に挙げたコロケーション分析用設
計の虜になっていることを白状しなければなりません。

例えば上記の比較は、大きく次の観点によっています。
(1)コーパスそのものについて:規模・構成内容など
(2)コーパスのUser Interfaceについて:標準とされる分析ソフトに関して

本来純粋な意味で「コーパス」の評価は(1)のみでされるべきなのかもしれま
せん。
例えばBrown CorpusやLOB Corpusの評価は通常(1)のみに対してなされます。
私が敢えて(2)を含めたのは現状のBNCやBOEは本体と分析ソフトの境目をユー
ザーに意識させない設計になっているからです。

> 「コーパスは大きければいいとは言えない」のか

これは前回書いた通り、設計が良ければ大きければ大きいほどいいというのが私
の立場です。

> そこでお伺いしたいのですが Church and Mercer が述べているような状況
> は今も変わっていないのかということです.

この点に関しては井上先生もお書きになっておられますが、私も変わっていない
と思います。
もっとも、ただ無造作にコーパスを大きくしていけばいいかというと、そうでは
ないことは言うまでもありません。

Corpora Mailing Listで今月初めにcorpus vs. archiveの論争があり、興味深く
読んでいました。
このリストでの議論は参加者以外でもWeb上で見ることができるのでしょうか?
今回のこのlexでの議論に関してもかなり参考になるのではないかと思います。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>


→ログメニューへ