【辞書学メーリングリストログ】 →ログメニューへ

1999年1月 (1日〜10日)


From: 村田 年 <>
Subject: [lex] 自由連結の重要性 {01}
Date: Fri, 01 Jan 1999 01:54:57 +0900

     学習英和辞典制作のためのコーパスの大きさ

村田 年(千葉大)です.
明けましておめでとうございます.

赤野先生,井上先生,東海林先生の書き込みでコーパスは大きい方が
ベターだということはわかります.

赤野先生:
頻度の低い語を1千万語のコーパスで検索し
た場合と、1億語のコーパスで検索した場合を比較すると、その結果はかなり違
ってきます.1億語のコーパスで検索するのは、あたかも拡大鏡で観察しているよ
うな感じです.1千万語でははっきりしなかった規則的パターンが1億語では鮮明
に見えてくることがよくあります.

井上先生:
まずは一般論として,大きければその方がデータの客観性は高くなると思います。

基本的には変わっていないように思います。用例をとにかく見たいのであれば,
コーパスサイズが大きい方がいいでしょうね。

東海林先生:
>  2)コーパスは大きければいいとは言えない.
これは「大きくし方」によるのではないでしょうか?
確かにBank of Englishの「大きくし方」は「大人志向」です。

「学習辞典作り」を念頭に置いた「大きくし方」であれば、「コーパスは大きけ
れば大きいほどいいと言える」というのが私の考え方です。

付け加えますと、(広義の)コロケーションの統計的研究で、CobuildDirect
(50 million) とBank of English (320 million) の両方による分析を経験しま
したが、明らかに後者の方が精密なデータを取れます。

適切な設計により作られた巨大コーパス(大きけれ
ば大きいほど良い)があれば、複数のコーパスの必要性は下がるのではないで
しょうか?

(村田:部分的な引用で誤解されませんように.)

村田の意見:
3人の先生のコーパスは大きい方がいいというご意見は理解できますし,
私も語を調べる,語をより正確に記述する点だけを考えれば同意見です.

しかし,学習英和辞典編集に全面的に使うとなれば,話は違ってくると
申しているわけです.

1.現行のどこかのコーパスを借りるとすれば,アメリカ英語の資料が
少なすぎます.大きなコーパスではこれを補うのは極めて困難です.

2.仮にコーパスを日本で作った場合,500万語と同質の1億語のコーパ
スを作ることは難しいでしょう.Spoken, 高校生用の資料から,という
点で.

3.実際の執筆に際して.執筆者の自宅のパソコン内にコーパスがある場合.
(コーパスを作っていらっしゃる)赤野先生に伺いたいのですが,パソ
コンで1億語のコーパスから KWIC,純粋頻度,put+off などの連結の検
索時間は500万語の20倍,2000万語の5倍はかかるのではないでしょう
か.これですと大変に執筆の調子が乗らないわけです.コービルドや BNC
の大型コンピュータの場合とまったく異なる,と推察しているのですが.
(私にはその力はありませんが)この点を東海林先生はほとんどお考え
になっていないのではないでしょうか.

4.コービルドのような既成のコーパスを借りた場合,大きいとたいへ
んな費用で採算は合わない恐れがありますし,現実にはどうやって使う
のか,想像できません.(かつてコービルドから日本の出版社へのコー
パスの売り込みがありました.うろ覚えですが,700万語のコーパスで
900万円だったか?でしたね.辞書そのものの使用権の売り込みもあり
ますね.

5.私は個人的には英和辞典のためのコーパスは日本で作るべきだと思
っています.そのためには出版社は協力し合わなければならないでしょ
う.1社では無理です.「コーパスを使った」ということだけでは宣伝
にはならなくなりますが.

6.一般語は出力されたデータだけでも書けるかも知れませんが,基本
語となると同意語・反意語との比較などがあり,データ,統計処理など
が動かないといけません.ホスト・コンピュータ方式もみんながアクセ
スすると待ち時間が長くなったり,ステーションが複数になれば出版社
の費用がパソコン1台ずつ持たせるよりかかってしまうかも知れません.

機器は日進月歩ですが,今スタートしてもコーパスを作りながらですと
6年以上はかかるでしょう.2,3年先なら第1号が出るまでに10年
はかかりますね.その時は英国の辞書はどこを走っているでしょうか.
できるだけ早く始めないと...



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {03}
Date: Thu, 31 Dec 1998 18:43:03 -0000

東海林@バーミンガムです。

こちらではまだ大晦日ですから、新年の御挨拶は次のメールあたりで…

Wed, 30 Dec 1998 00:24:12 +0900の村田先生のメールに対して

>  problem の場合は先生も言われているように,共起頻度から t-scoreが予
> 想できるわけです.一般的に t-scoreのおおまかな予想(この連結よりこち
> らの方が高いだろうといった)はかなりできるのではないでしょうか.2,
> 3ヶ月執筆を続けていきますと自分のコーパスでの機能語の生起頻度の大体
> の順番が頭に入ってきますので.

統計数値が予想できるということは申し上げたつもりはないのですが…
私にとって「統計」とは、辞書編集を「職人芸」(村田先生のお言葉では「名人
芸」)から「科学」に一歩近づけるための補助手段です。
ですから予想したとしても、当たる場合もあれば外れる場合もあるのは当然のこ
とととらえ、統計数値は言語現象の「ある一面」を客観的に表示するものである
と思っております。

>  一般的には apple のように t-score はあまり意味のない連結が並びます.
> これの解釈で時間を取ったり,頭が混乱したりしないためには,まず KWIC
> と共起頻度で概略を書いてみる方がいい,これが少しばかりの経験に基づく
> 私の意見です.

仮にappleの1語前の共起語を純粋頻度順に並べたとして、それが「意味のある
連語」の表示になるのでしょうか?
t-score順に意味がないとしたら、純粋頻度順にも意味がないと私には思えるの
です。

>  big と crab が強い連結があるのは共起頻度だけでもわかります.
> t-score に慣れるまでは直接 crab の頻度を求めて判断した方が実感で
> きるのです.

bigはともかく、crabに関しては純粋頻度順にするともっと順位が下がってしま
います。
t-score順であるからこそ、上位に上がって「意味のある連語」ではないかとい
う予想がしやすくなるのではないでしょうか?
(ただし、crab appleが特定のサブコーパスに集中している可能性があるので、
その点はしっかりと調べなければなりません。)

> 東海林先生,この点について自分の発言を反省しています.簡単に引き下が
> らないでいただきたかったですね.機能的・文法的なコロケーションに焦点
> をあてた t-score は私にも曲がりなりですが理解でき,かなり予測もでき
> ます.が,MI-score は理解が今ひとつであり,これはいいという実感を自
> 分の執筆ではまだ得ていません.しかし,あらゆる意味的なコロケーション
> に焦点があると聞くと極めて魅力的です.井上永幸先生をはじめ何人かの論
> 文で目のさめるような発見に出会い,これはすごい,と一方では思っている
> わけです.

「機能的・文法的なコロケーションに焦点をあてた t-score」との御発言に関し
て、これは実は以前井上先生への個人メールで申し上げたことがあるのですが
(^_^;)、必ずしもそうは言い切れないのではないかと私は考えています。
個人的な分析経験から、「意味的なコロケーション」の分析にあたっても、まず
はt-scoreから出発するのがいいと考えています。
データから詳細をお示ししたいのですが、これは実はある場で発表するネタです
ので(^_^;)、今のところはこのあたりで勘弁していただければ幸いです。

> 私の議論はすべて自宅のパソコンにコーパスがあることを前提にしています.

この点私の誤解があったようで失礼致しました。

> 私はもう年で,時間がありませんので,早くコーパスに基づく英和辞典が見
> たいですね.投野先生が秘密がまったくなくて何でも発表してしまうイギリ
> スの辞書界を半ばあきれて紹介していますが,日本ももう少し社内秘をへら
> して各社が協力する体制にすべきです.現状では辞書そのものが見放されか
> ねません.大修館の飯塚さんをはじめ各出版社の方の最近の書き込みに少し
> 期待が持ち始めております.

「British National Corpusに基づいた」と謳っている各出版社の辞書がそれぞ
れ個性を保っているように、同じコーパスを用いるから画一的な辞書になるとは
言い切れないのですよね。
著作権について申し上げたこととも関連しますが、コーパス作りは個人技では限
界があるのですから、協力体制は本当に理想的だと思います。
村田先生の御発言は力強い限りです。

> コーパスに詳しい方の書き込みを期待しているのですが,机上の空論で相手
> にしにくいとお考えでしょうか.

私の発言の方が「机上の空論度」は高いのではないかと反省しております。
SvensenのPractical Lexicographyという著作がありますが、Corpus-based
Practical Lexicographyという分野が日本でも確立してほしいと願っています。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {04}
Date: Fri, 1 Jan 1999 01:57:36 -0000

東海林@バーミンガムです。

新年明けましておめでとうございます。
昨年はこのメーリングリストで大変勉強させていただき、どうもありがとうござ
いました。
本年も及ばずながら、議論に参加させていただきたく、どうぞよろしくお願い申
し上げます。

井上先生のメールWed, 30 Dec 1998 06:05:26 +0900に対して:

> コーパスと辞書編集の議論,興味深く拝見しております。このままコーパス
> に基づく辞書ができるのではないかというくらい,議論が具体的ですね。
> (^_^;)

未熟者ながら、どうも口ばかり達者ですみません。

> こういった統計数値はしょせん確率の問題ですので〔たとえはあまりよくな
> いですが,%表示による天気予報のようなもの〕,リストの上位にあがって
> いるものでも,偶然リストの上に上がってきているものもあり,結局は利用
> 者が KWICと見比べながらその数値の意味を再確認する必要があるわけです。
> 一方,何万何千行というKWICを見てアイディアをひねり出すより,一目で問
> 題のキーワードの注目すべき現象を把握することができることもあるわけで
> す。

そうですね、特にt-score順のリストの場合、KWICよりも効率的に共起情報が得
られることが多いのを実践的に体験しております。
もちろん、KWICは不要では決してなく、それこそが基本であるべきですが、
t-score順のリストを元にして「あたり」をつけてからKWICを見ると得るものは
大きいのです(特に頻度の高い語を対象とする場合)。

> すでに東海林先生も詳しく書かれていますが,MI-scoreは特に,キーワード
> の周辺に生起する特徴的な語〔期待値よりも実験値の高い語〕がリストの上
> 位にあがってきますので,サンプルのテクストに偶然扱われていたテーマや
> 固有名詞がリストの上位にあがってくる可能性が高くなります。したがって,
> 本当の意味でキーワードと連語関係にないものもリスト上位にあがってくる
> ことになりますが,こういったものは常識的判断や, KWICを検証すること
> によって排除することができます。そのような癖さえ知っていれば,ないよ
> りはあった方が断然いいですね。
>                                 (^_^)

2つの統計的手法に関して、t-scoreから出発すべきであることを強調するあま
り、MIは全く不要であるかのような書き方をしてしまったかもしれませんが、
「ないよりはあった方が断然いい」という点は同感であります。

再度反論があるのを承知で書きますが、個人的には(広義の)コロケーション情
報を学習辞書に導入する場合、次の順で有効性が高いと思っています。

t-score>純粋共起頻度>MI-score

村田先生のメールThu, 31 Dec 1998 00:10:08 +0900に対して:

COBUILDコーパスの「ノイズ」ですが、確かに気になることがあります。

> このようにコービルドはコーパスを大きくするためにかなりのものを犠牲に
> している印象を受けました.

ただ、コーパスが大きくなるにつれて、「ノイズ」が統計的な意味での「誤差」
の範囲に収まってくることも考えられます。
以前のメールの繰り返しになりますが、「大きくし方」によるわけですが…

再び井上先生のメールThu, 31 Dec 1998 08:04:33 +0900に対して:

> 既成のコーパスでは「米」の部分が決定的に不足していますね。

これは本当にそうですね。
ただ、TALC98に参加した時にわかったのですが、Cornell Universityと
Cambridge University Pressが組んで、口語米語のコーパスを作ることが決定し
たりといった動きもあります(NottinghamのMcCarthy氏が関与しているとのこ
と)。
CIDEの次の版をにらんでのことなのでしょうね。

日本で独自に英語コーパスを作る場合、英米比、書き言葉/話し言葉比など、議
論すべきポイントは多々あると思います。
Bill GatesやRupert Murdockのような大金持ちが日本の英語辞典のためのコーパ
ス作成資金を投資してくれないでしょうか(^_^;)?
(Gatesは投資しても利益を独占しそうな雰囲気ですね。NODEでMurdock2を引い
たら、なんとこの方はHarperCollinsも所有していらっしゃいました。COBUILDの
金銭的現状を見ると、こちらもあまり期待できないかも(^_^;)。)

最後は脱線が過ぎました。失礼致しました。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: Nagayuki Inoue <>
Subject: [lex] Corpus & Dictionaries {04}
Date: Fri, 01 Jan 1999 11:06:57 +0900

井上(島根大学)です。

あけましておめでとうございます。
本年も有意義な議論が行なわれることを願っております。

> 「機能的・文法的なコロケーションに焦点をあてた t-score」との御発言に関し
> て、これは実は以前井上先生への個人メールで申し上げたことがあるのですが
> (^_^;)、必ずしもそうは言い切れないのではないかと私は考えています。
> 個人的な分析経験から、「意味的なコロケーション」の分析にあたっても、まず
> はt-scoreから出発するのがいいと考えています。

東海林先生,私の書いたものの一部(?)を引用されていますが,上の引用の仕
方は少々ミスリーディングです。当時先生にお送りした私の回答メールを張り付
けておきます。

> おっしゃるとおりです。t-scoreは基本的に標準偏差なので,頻度が高ければ,意
> 味的な結びつきが高い語でも上位に現われてきます。文法的な機能語は大体にお
> いて頻度が高くなるので,t-scoreにおいてしばしば上位を占めるのはそういった
> ところからです。
>
> 私がした説明は,初めてこれらの説明を聞かれた方々がよくされる質問として,
> t-scoreとMI-scoreの違いが分からないということがありまして,それをもっとも
> 単純化して〔その違いが対照的になるように〕行なっております。おっしゃるように,
> 正確にはt-scoreは意味的なつながりの強い語も拾ってくることもありますので,そ
> ういった意味で,私は「リストアップするのに役立つ」といっており,「リスト
> アップする」とは言いきっていないわけです。(^_^;)

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {05}
Date: Fri, 1 Jan 1999 02:23:39 -0000

井上先生、言葉が足りずにまた誤解を招いてしまいました。

>東海林先生,私の書いたものの一部(?)を引用されていますが,上の引用の

>方は少々ミスリーディングです。当時先生にお送りした私の回答メールを張り

>けておきます。

「」内に私が引用したのは、村田先生の御発言でありまして(その直前の>付き
引用からの引用)、井上先生のお言葉であるかのように誤解を招きやすい表現を
してしまいました。
両先生に心よりお詫び申し上げ、今後は慎重な発言を心掛ける所存です。
失礼致しました。

東海林 宏司

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
Subject: [lex] コーパスのネットワーク利用 {01}
Date: Fri, 1 Jan 1999 12:01:01 -0000

東海林@バーミンガムです。

松本先生:

> 来年(といっても明日からですね),佐賀でインターネット無料接続サービ
> ス(県の実験です)が始まるのですが,コーパスをクライアントから操作す
> るにはどうすればよいのでしょうか。現在,MicroConcord を利用していま
> すが,そういった既存のソフトを利用できるのであれば,ぜひ県に提案して
> みたいと思っています。

この御質問に対するお答えは次の条件によって大きく変わってきます。

1.佐賀県の「インターネット無料接続サービス」の内容
2.利用を希望されるコーパスの具体名

この2点に関してお答え願えますでしょうか。

一般論としては、アクセス権をきちんと獲得した上での個人利用を超える利用は
難しいと思います。
MicroConcordのようなテキストファイルとしてのコーパスに直接アクセスするこ
とが必要なソフトを用いて、既成のコーパスをネットワーク利用することは、現
実には不可能に近いのではないでしょうか。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Suga" <>
Subject: [lex] コーパス・デザインについて {01}
Date: Fri, 1 Jan 1999 21:36:32 +0900

--U2F0LCAwOSBKYW4gMTk5OSAxNToxMTozOCArMDkwMA==
Content-Type: text/plain

This is a multi-part message in MIME format.

----------------------------------------------------------------
須賀(倉敷天城高校)です。あけましておめでとうございます。
村田先生のご発言を発端として,先生方の活発なコーパスについて
のお話を大変興味深く拝読いたしております。また,村田先生には
拙著への言及をいただきありがとうございました。

コーパスの規模につきましては,私も「大きければ大きいほどよい」
と思います。それでは1億か,10億か,100億かといわれると何とも
いえませんが,大きくなればなるほど変化の差が小さくなることは
予想されます。BNCのように「素性のはっきりした」コーパスは確か
に安心できますが,かといってこれが現状の英語を反映していると
断定はできません。ブラウン・コーパスもそうですが,こうしたサンプ
ル・コーパスの大きな欠点の1つは,完成した時点で「老化」がはじ
まることです。

ところでG.Kennedy(An introduction to Corpus Linguistics)はマオ
リ語の口語コーパスを作成するのにマオリ語放送の放送内容の割
合を参考にする例を紹介しています。コーパスをデザインする上で
こういうものを参考にすればよいというお考えがおありでしたら,お教
えいただけませんか。思いつきですが,書店などは読者の要求に
敏感ですから,総合書店のどういう種類の本がどのくらいのスペース
を占有しているかなどを調べるのもいかがでしょう?(マンガばっかり
かも?)

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"
倉敷天城高等学校   須 賀  廣
email  : 
Home Page :  http://www1.harenet.ne.jp/~suga

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"



From: "Hideshi TAKAIE" <>
Subject: [lex] RE: [lex] コーパス・デザインについて {01} {01}
Date: Fri, 1 Jan 1999 22:38:44 +0900

--U2F0LCAwOSBKYW4gMTk5OSAxNToxMTozOCArMDkwMA==
Content-Type: text/plain

This is a multi-part message in MIME format.

----------------------------------------------------------------
あけましておめでとうございます。
「辞書作りにおけるコーパス利用」についての活発な意見を読ませていただき、得る
ところが多くて、感謝しております。すでに、須賀先生より我々の拙著について報告
があったようですので、今日は少し観点を変えたところで、問題を提起させていただ
きます。
@コーパスの規模について:手作り2000万語のコーパスを利用していますが、たとえ
ば out of orderを補語に従える主語について検索しても40例ほどしか検索できませ
ん。すると、俗に言われているような「公共物の故障について述べる」という風な制
約が、本当にあるかどうか、判断がつきかねます。最低でも、1億語、可能であれ
ば、10億語などというのは初夢に終わってしまうのでしょうか?村田先生がおっしゃ
る「学習辞典編纂」という目的の場合、あまり、BNCのようなバランスを考えなく
ても、というのが個人的な印象です。

ABNCの構成については、拙著の巻末に示していますが、あれは、BNCの素材の
分析であって、「いかなる観点から現代英語の全体像を示していると言えるのか」ど
こにも答えは示されていません。たとえば、書き言葉の素材の分野は創作が約1900万
語に対して自然科学が350万語、応用科学が700万語、社会科学が1300万語、世界情勢
が1600万語、思想・信条が300万語...etc.となっているようですが「なぜこの割合が
現代英語」を代表するのか私の知る範囲内では示されていないように思われます。そ
れどころか、誰が「現代英語」を代表させる素材の割合を決定できるのでしょうか?
人文科学の分野では「いくつかの観点」でのみ何かを反映させるような工夫(例えば
「話し言葉」の素材を現代イギリスの人口構成に合致するように集めてくる」など)
は可能でしょうが、すべての点で「完全無欠」な工夫・研究は不可能に思えるのです
が。

B書き言葉でも、個人的にはいわゆる「純文学」の素材より、大衆小説のほうが、一
般的な言語使用の実態を反映しているように思うのですが。『教養としての言語学』
(鈴木孝夫、岩波新書)のP.134-135に「高度な芸術性を狙った技巧的な文章の多
いいわゆる純文学の作品よりも、気取らない平易な文章で書かれた(大衆)風俗小説
の方が、自然な言葉の分析資料としては適している......」という記述があります。
書き言葉、それも小説などを素材にする場合でも、以上のような観点も、実際にコー
パスを構築する場合、重要な観点になると思われます。そう言えば、毛利可信先生の
著作に、やたらとクリステイが出てくるのは、もしかしたら偶然ではなったかのも知
れません。個人的な経験でも、コナン・ドイルの作品には、コーパス利用の際に、世
話になったことが多いように思われます。
=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
================================================='"



From: 村田 年 <>
Subject: [lex] Corpus & Dictionaries {01}
Date: Sat, 02 Jan 1999 01:02:39 +0900

東海林先生

村田 年(千葉大)です.

純粋頻度には多少慣れている(?)ものの t-score, MI-score には
まったく慣れていない(使ったことはあるのですが)ことが,私が
純粋頻度を推す最大の理由かも知れないなー,と反省しております.

私のわかりかたは 「crab はその語自体の生起頻度が低いだろうに
こんなに出ているよ」といった,あまり科学的でないわかりかたです.
t-score にもう少し慣れる必要があろうかと思っております.
純粋頻度の最大の特徴は今日始めると今日完全に理解できる点です.

東海林先生:
<そうですね、特にt-score順のリストの場合、KWICよりも効率的に共起情報が得
<られることが多いのを実践的に体験しております。
<もちろん、KWICは不要では決してなく、それこそが基本であるべきですが、
<t-score順のリストを元にして「あたり」をつけてからKWICを見ると得るものは
<大きいのです(特に頻度の高い語を対象とする場合)。

話を蒸し返して恐縮ですが,t-score が KWIC よりも効率的に共起情
報を得られる,のはその通りだと確信します.では純粋頻度はどうで
しょうか.私の場合相当大きな語でも純粋頻度表の第1〜3ページで
その語のコロケーションの概略をつかめるような気がします.文化系
の人間ですとおそらく私のように感じる人は多いと踏んでいるわけで
す.赤野先生も先ずは KWIC と純粋頻度を勧めておられます.
私の場合先ずは純粋頻度で「あたり」をつけるわけです.やや科学的
に劣る方法であることは認めます.
純粋頻度>t-score>MI-score となります.
(純粋頻度は 1992年以来扱ってきました.t-score, MI-score につい
ては 1994年に井上先生の論文で知り,自分のパソコン上でも扱ってみ
ましたが,扱いが下手なせいか,実感として理解できていません.

井上先生によると c-score というのもあるのですか?
それから東海林先生,typical というのは使っていらっしゃいますか?



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {05}
Date: Fri, 1 Jan 1999 22:14:45 -0000

東海林@バーミンガム(残り3か月)です。

村田先生や井上先生の御発言から、私も次の点を考えるようになりました。

1.既成のコーパスで英和辞典を作ろうとすると、やはり米語と口語が足りな
い。
2.既成のコーパスは「大人の英語」に偏り過ぎである。

以上2点から、例えば日本の出版社が英国出版社と契約してコーパスを用いるよ
うな場合、日本の英語教育事情と合わない英和辞典が出来てしまう恐れがあるの
ですね。
やはり村田先生がおっしゃるように、英和辞典作成のためのコーパスは日本主導
で作るべきだと思います。
「金銭面」という決定的な問題があるのは承知の上で、敢えて「机上の空論」を
させていただきますが、今議論されているコーパス規模の問題に加えて、英米
比、書き言葉/話し言葉比という基礎的な問題をこのリストでも議論しておくべ
きだと思いました。

<コーパス規模>

やはりこれからコーパスを設計しようという場合、最低でもBNCの1億語は必要
かと思います(鷹家先生と同意見です)。
そこを第一次完成点として、予算が許す限りopen-endedに近い拡大を目指すのが
望ましいように思います。

村田先生はコーパスが大きくなることにより、パソコン上での分析に時間がかか
ることを心配していらっしゃいます。
確かに5年ほど前までは、パソコンと「大型コンピュータ」の差は歴然としてい
て、御心配の点は当たっていたと思います。
けれども現状ではいわゆる「売れ線」のパソコン上で、BNC程度の規模のコーパ
スならば速度をほとんど気にせずに分析できるのではないでしょうか。

<英米比>

「英米比」と書いてから、USAの意味での「米」では狭すぎるなと感じました。
加えて、オーストラリア・ニュージーランドの英語も無視できないのではないか
とも思いました。
そこで、「英米比」改め「地域別比」を次のように考えてみました:

英:40%、オーストラリア・ニュージーランド:10%
米:40%、カナダ:10%

如何でしょうか?

<書き言葉/話し言葉比>

これが一番難しい問題かと思います。
一般的に言って、書き言葉が多ければ多いほど、(著作権の問題は別として)
コーパス構築は楽になります。
日本主導で純粋な意味でのspontaneous speechのコーパスが作成できるのかとい
う問題もあります。
けれども、理想的には話し言葉が20〜40%程度あることが望ましいのではな
いでしょうか?

以上、初夢のアドバルーンを上げてみました。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From:
Subject: [lex] 検索 TOOLCorpus Wizard for Win32 次世代へ向けて試作版 {01}
Date: Sat, 02 Jan 1999 13:18:48 +0900

あけましておめでとうございます。

最近のPCの高速化を前提に、これまでは私の環境では重くて使い物にならないと判断し
ていた機能をつけて行くように方針転換しましたが、今回はその2弾に当たります。

・検索対象ファイルを登録し、ボタン一つで選択できるようにする
  (KWIC検索[範囲指定]でテスト)
  検索設定用のダイアローグの下に6つまで登録できるようになっています。ただし
  まだ一回設定した物を変更する機能はつけていません。
・「拡張統計」追加
  テキスト中での使用頻度と、検索結果の中でのキーワードを基準とした位置ごとの
  出力し、その単語がキーワードとの結び付きが強いかどうか判断できるようにした
  出力形式などまだ未定だったりするので、御意見を求む
   現在の出力形式: 検索結果に出てきた単語の頻度をそれぞれの位置(L5..R5)ごと
   の処理対象結果数で割ったものと、検索対象ファイル内での頻度をパーミルで並
   べて出力。
  現バージョンでは検索対象ファイル内の単語の使用頻度はそのつど計数しなおして
  いる。これは将来あらかじめ作っておいたデータから読み込めるようにして高速化
  する。
・対応しているmbex.dllのバージョンを1.06にした
・作業中断用に作成するファイルの形式変更に伴い、従来までの上位互換は廃止した

アルファ版のためこのバージョンから使うことは想定していませんのでヘルプなどは
入っていません。

まだ動作環境は変わっていませんのでWin-OS2+Win32sでも使うことが出来ます。

ダウンロードは
  http://www2d.biglobe.ne.jp/~htakashi/indexj.html
から「ソフトウェア」-->「アルファ版」とたどって下さい。

--
= 神戸在住の 浜口 崇(HAMAGUCHI Takashi) =
=[ http://www2d.biglobe.ne.jp/~htakashi/ ] ==



From: "Matumoto Yosihito" <>
Subject: [lex] コーパスのネットワーク利用 {01} {01}
Date: Sat, 2 Jan 1999 15:30:51 +0900

東海林先生,みなさまあけましておめでとうございます。佐賀の松本@コーパス初心
者です。

>1.佐賀県の「インターネット無料接続サービス」の内容

県の補助事業で,詳しい内容は不明です。概容は,佐賀県のケーブルテレビ網を使っ
てインターネットとの接続サービスを行うというものです。高速性(10Mbのファイ
ルを数分でダウンロードできるようです)を生かした研究内容であれば,補助金がで
ます。

>2.利用を希望されるコーパスの具体名

ここが不明なのです。コーパスというのは,テキストファイルデータベースのことだ
と思うのですが(すみません間違っていたらご指摘ください),これをみなさまのお
知恵を拝借して構築できないものか,と考えていました。商用だと版権の解決が難し
いと思うのですが,非営利目的であれば,みんなの知恵を持ち寄ってできないのかな
?と素人考えで思ったのです。つまり既存のコーパスではなく,新たに構築するとい
う無謀な考えをもっていた(いる)のです。せっかく県がお金を出すといっているも
のですから。

>MicroConcordのようなテキストファイルとしてのコーパスに直接アクセスするこ
>とが必要なソフトを用いて、既成のコーパスをネットワーク利用することは、現
>実には不可能に近いのではないでしょうか。

ということは,もし先ほど申しましたような内容のコーパスを作るとしたら,ネット
ワークで利用できるソフトの開発から必要になる,ということでしょうか。それと
も,もっと別の手段が考えられるのでしょうか。



From: "Hiroshi Shoji" <>
Subject: [lex] Statistics in lexicography {01}
Date: Sat, 2 Jan 1999 11:54:20 -0000

東海林@バーミンガムです。

村田先生:

> 純粋頻度の最大の特徴は今日始めると今日完全に理解できる点です.

おっしゃる通りで、白状しますと、私も昨年こちらに来るまでは「純粋頻度」以
外の方法で共起現象を分析することについてはほとんど知識がありませんでし
た。
Jeremy Clearの論文を読んだり、コーパスを使い込んだりして、統計の有効性を
感じるようになったのです。
この議論の初めの方で例に挙げた「強調副詞+形容詞」の共起を分析する過程
で、それは一層強く感じられるようになりました。
一番の有効性は純粋頻度では恣意的になりやすいthresholdを客観的に設けるこ
とができる点にあると思います。

> 井上先生によると c-score というのもあるのですか?

c-scoreというのは私は存じません(井上先生にお教え願えれば幸いです)。
次の文献では、共起の統計分析としてz-scoreという方式も紹介されています。

Barnbrook, G (1996) Language and Computers. Edinburgh University Press.

見たところ、z-scoreはMIに近い結果を出力するようです。
辞書学的な意味についてはもう少し勉強してみたいと思います。

> それから東海林先生,typical というのは使っていらっしゃいますか?

私は使っておりません。
こちらの方も詳しい方のフォローをお願いできると嬉しいのですが…

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 村田 年 <>
Subject: [lex] Corpus & Dictionaries {01}
Date: Sat, 02 Jan 1999 20:54:46 +0900

コーパスの規模と資料の構成とパソコンの能力

村田 年(千葉大)です.

須賀先生, 鷹家先生, 浜 口 様(浜口さん,お元気でしたか?)
のメールを読む限り,私のようなコーパス運転の初心者の心配は的外れ
のような気がします.しかし,今まで使わせてもらったコーパスは重要
基本語となると遅くてお茶を飲んでくるか,郵便局へ行ってくるとちょ
うどいいといった感じでした.例えば句動詞 put + on などを検索する
とたいへんに長い時間がかかるので(2000万語程度で),1億となると
どうなるだろうと思ってしまいます.

須賀先生:
コーパスの規模につきましては,私も「大きければ大きいほどよい」
と思います。それでは1億か,10億か,100億かといわれると何とも
いえませんが,大きくなればなるほど変化の差が小さくなることは
予想されます。

(村田)10億になっても検索時間は大丈夫ですか?

鷹家先生:
@コーパスの規模について:手作り2000万語のコーパスを利用していますが、たとえ
ば out of orderを補語に従える主語について検索しても40例ほどしか検索できませ
ん。

(村田)東海林先生は個人の手作りコーパスはだめだ,と言われていま
すが,あまり構えると1出版社がいつになってもコーパスを持てないこ
とになってしまいますね.個人と団体の境界線もあいまいですから,先
ずはコーパスを持つことが重要だ,と私も意見を和らげてもいいと思っ
ています.

鷹家先生:
村田先生がおっしゃ
る「学習辞典編纂」という目的の場合、あまり、BNCのようなバランスを考えなく
ても、というのが個人的な印象です。

(村田)学習辞典,学校文法・語法だからこそバランスが大事だと思っ
てきたのですが,違ってますでしょうか.

東海林先生:
村田先生はコーパスが大きくなることにより、パソコン上での分析に時間がかか
ることを心配していらっしゃいます。
確かに5年ほど前までは、パソコンと「大型コンピュータ」の差は歴然としてい
て、御心配の点は当たっていたと思います。
けれども現状ではいわゆる「売れ線」のパソコン上で、BNC程度の規模のコーパ
スならば速度をほとんど気にせずに分析できるのではないでしょうか。

(村田)「売れ線」のパソコンは今私が使っているものに較べてそんな
に速いのですね.ちょっと信じられない感じです.problem ですと
2000万語のコーパスで 4000から4500例出てきます.2億とすると,
4万例です.この場合の KWIC と純粋頻度を出す時間は気にする必要
がないぐらいですか.(実際出すときは typical を使って用例は制限
するにしても)

東海林先生:
<書き言葉/話し言葉比>
これが一番難しい問題かと思います。
一般的に言って、書き言葉が多ければ多いほど、(著作権の問題は別として)
コーパス構築は楽になります。
日本主導で純粋な意味でのspontaneous speechのコーパスが作成できるのかとい
う問題もあります。
けれども、理想的には話し言葉が20〜40%程度あることが望ましいのではな
いでしょうか?

(村田)辞書作成の場合「話し言葉」を厳密に考える必要はなく,映画
のシナリオも話し言葉,少々字幕に省略があっても OK とすべきでは思
っています.談話分析の研究ではありませんので.いかがでしょうか.

浜口様:
最近のPCの高速化を前提に、これまでは私の環境では重くて使い物にならないと判断し
ていた機能をつけて行くように方針転換しましたが、今回はその2弾に当たります。

(村田)「高速化」の点で,それほどの違いがあるわけですか.
お示しのものをダウンロードして使えるほどの腕が私にあればす
  ぐにやってみたいのですが,残念です.



From:
Subject: [lex] Corpus & Dictionaries {02}
Date: Sun, 03 Jan 1999 01:02:57 +0900

>(村田)「高速化」の点で,それほどの違いがあるわけですか.

だってCPUのクロック数だけ見ても、私の保有する物は16MHzと33MHz。それに対
して最近のPCは400MHzもありですから(^_^;)それにCPUのアーキテクチャの変更
に伴う速度向上も無視できませんし、HDDは容量が大きくなれば速くなる傾向が
あります。グラフィックもかなり速くなってきているし。10倍どころか少なく
とも100倍くらいは速くなっているとおもっています。

# 私の環境でHDD上のデータに対して検索するより、CD-ROMからデータを読み込
# ませてもなお速い機械が「ふつー」に売られている時代です。

今年はぜひ1台買いたいです。元手を作るために御仕事下さい(^_^;)

> お示しのものをダウンロードして使えるほどの腕が私にあればす
>  ぐにやってみたいのですが,残念です.

簡単に使えるようにするというのも一つの目標なんで、そういう方にこそ人柱に
なっていただけるとありがたいのですが(^_^;)

# ボタン一つで検索対象を切替えられるというのがそれにあたります

--
= 神戸在住の 浜口 崇(HAMAGUCHI Takashi) =
=[ http://www2d.biglobe.ne.jp/~htakashi/ ] ==



From: "Hiroshi Shoji" <>
Subject: [lex] コーパスのネットワーク利用 {01} {02}
Date: Sun, 3 Jan 1999 01:33:29 -0000

東海林@バーミンガムです。

松本先生:

> >1.佐賀県の「インターネット無料接続サービス」の内容
>
> 県の補助事業で,詳しい内容は不明です。概容は,佐賀県のケーブルテレビ
> 網を使ってインターネットとの接続サービスを行うというものです。高速性
> (10Mbのファイルを数分でダウンロードできるようです)を生かした研究
> 内容であれば,補助金がでます。

私の知る限りでは、いわゆるLAN接続という形の一形態を用いると、サーバー
をクライアント(ユーザー側のパソコン)から1つのドライブとして見立てるこ
とができます。
そうすれば、サーバー上のテキストファイルにクライアント側にある分析ソフト
(MicroConcordなど)を用いてアクセスすることができます。

> >2.利用を希望されるコーパスの具体名
>
> ここが不明なのです。コーパスというのは,テキストファイルデータベース
> のことだと思うのですが(すみません間違っていたらご指摘ください),こ
> れをみなさまのお知恵を拝借して構築できないものか,と考えていました。
> 商用だと版権の解決が難しいと思うのですが,非営利目的であれば,みんな
> の知恵を持ち寄ってできないのかな?と素人考えで思ったのです。つまり既
> 存のコーパスではなく,新たに構築するという無謀な考えをもっていた(い
> る)のです。せっかく県がお金を出すといっているものですから。

「構築」という点だけを考えれば、無理な話ではないと思われます。
けれども、著作権の問題をクリアせずに、誰でもネットワークからアクセス可能
という形にしてしまうと、「非営利目的」と謳ったところで、営利目的に利用さ
れてしまう可能性を捨て切れないのではないでしょうか?
現行の名の知られているコーパスがライセンスを「売る」という形でユーザーに
使用を認めているのは、ユーザーの情報を把握することによって、営利目的で利
用された場合の法的手段に備えているという面もあろうかと思います。

> ということは,もし先ほど申しましたような内容のコーパスを作るとしたら,
> ネットワークで利用できるソフトの開発から必要になる,ということでしょ
> うか。それとも,もっと別の手段が考えられるのでしょうか。

ポイントは、アクセス権を制限することにありそうです。
コーパスへの完全なアクセス権を不特定多数に認めるのではなく、手続を踏んだ
限られたユーザーのみに許可するという形にしなければ、営利目的に使用される
ことを防止できません。

私はネットワークの技術的側面に関する知識が乏しいため、理念的なお答えしか
できないことを御了承願います。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {06}
Date: Sun, 3 Jan 1999 02:09:47 -0000

再び東海林@バーミンガムです。

村田先生:

> 東海林先生は個人の手作りコーパスはだめだ,と言われていますが,あまり
> 構えると1出版社がいつになってもコーパスを持てないことになってしまい
> ますね.個人と団体の境界線もあいまいですから,先ずはコーパスを持つこ
> とが重要だ,と私も意見を和らげてもいいと思っています.

どうも私は文章力に乏しく、誤解を受けてしまうことが多いようです(^_^;)。
個人の手作りコーパスは大いに結構です(私も構築経験があります)。
授業への利用、研究論文への利用など、非営利目的であればそれは大いに活用で
きるでしょう。
私が問題にしているのは、村田先生がお考えのような「英和辞典編集のための
コーパス」を個人で構築できるのか、という点です。

1.BNC規模のコーパスが望ましいという考え方に従うとすると、ゼロからス
タートして個人ではどのくらいの時間がかかるでしょうか?
2.英和辞典の編集に利用する場合には避けられない著作権の問題を個人の力で
クリアできるのでしょうか?

> 「売れ線」のパソコンは今私が使っているものに較べてそんなに速いのです
> ね.ちょっと信じられない感じです.problem ですと 2000万語のコーパス
> で 4000から4500例出てきます.2億とすると,4万例です.この場合の
> KWIC と純粋頻度を出す時間は気にする必要がないぐらいですか.(実際出す
> ときは typical を使って用例は制限するにしても)

この点に関しましては浜口様がお答え下さっています。
私も信じられないほどの容量拡大・高速化がどんどん起こっています。

> 辞書作成の場合「話し言葉」を厳密に考える必要はなく,映画のシナリオも
> 話し言葉,少々字幕に省略があっても OK とすべきでは思っています.談話
> 分析の研究ではありませんので.いかがでしょうか.

映画の選び方さえ気をつければ、おっしゃる通りだと思います。
私が考えたのは、インタビューのスクリプトをコーパス化するというものです。
特に答えの部分は、spontaneous speechとみなせる場合が多いと思うからです。
記者会見はどうかなと思ったのですが、こちらはいわゆる「出来レース」があっ
た場合(答える方がメモをただ読んでいるような場合)、適切な口語コーパスに
はならないかもしれません。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Matumoto Yosihito" <>
Subject: [lex] RE: [lex] コーパスのネットワーク利用 {01} {01} {02}
Date: Sun, 3 Jan 1999 14:46:06 +0900

東海林先生,早速のレスありがとうございます。佐賀の松本です。

>私の知る限りでは、いわゆるLAN接続という形の一形態を用いると、サーバー
>をクライアント(ユーザー側のパソコン)から1つのドライブとして見立てるこ
>とができます。
>そうすれば、サーバー上のテキストファイルにクライアント側にある分析ソフト
>(MicroConcordなど)を用いてアクセスすることができます。

となると,インターネット経由でアクセスする方には利用価値が無いというわけです
ね。佐賀県内だけで使うとなると,インターネット接続の意味をなさないので,難し
そうです。

>「構築」という点だけを考えれば、無理な話ではないと思われます。
>けれども、著作権の問題をクリアせずに、誰でもネットワークからアクセス可能
>という形にしてしまうと、「非営利目的」と謳ったところで、営利目的に利用
>されてしまう可能性を捨て切れないのではないでしょうか?

もう少し大きなプロジェクトにして「英和辞典編集のためのコーパス」を視野
に入れ,著作権を一つ一つクリヤした方が良いのでしょうか。となると私一
人の手に負えるものではなくなりそうです(^_^;)。

>ポイントは、アクセス権を制限することにありそうです。
>コーパスへの完全なアクセス権を不特定多数に認めるのではなく、手続を踏んだ
>限られたユーザーのみに許可するという形にしなければ、営利目的に使用される
>ことを防止できません。

制限自体は難しくないのですが,個人や法人の特定に手間がかかります。つまり
「バーチャルな存在か,実在なのか」を確定する部分です。そこで考えたのですが,
学校の教職員のみにアクセス権を設定するというのはどうでしょう。申請は学校単位
で行う。一般の方(または外国人)はアクセス権を持つ方からの個人推薦の形を取れ
ば,特定の手間が省けます。そうすれば全世界からアクセスできるフリーウェアにし
ても良いのではないかと思うのですが。無償提供にこだわるのは,

1,時々に応じて利用者がコーパス構築に参加できる
2,改訂が随時できる
3,随時性が高いので陳腐化がない

といった点にあります。それに多くの研究に使われている雛形があれば,「英和辞典
編集のためのコーパス」を作るときにクリヤすべき問題点が「著作権」に絞られま
す。

ちなみに著作権をクリヤしていくとなると,どのような作業が必要になるのでしょう
か。またどのようなパワーが必要になるのでしょうか。



From: "Hideshi TAKAIE" <>
Subject: [lex] Corpus & Dictionaries {02}
Date: Sun, 3 Jan 1999 15:12:30 +0900

村田先生
以下の私の発言に対して:
>村田先生がおっしゃる「学習辞典編纂」という目的の場合、あまり、BN>Cのよう
なバランスを考えなくても、というのが個人的な印象です。

村田先生より:
>学習辞典,学校文法・語法だからこそバランスが大事だと思っ
>てきたのですが,違ってますでしょうか.

お返事をいただきました。私は、バランスのとれたコーパスの価値を貶めるつもりは
ありません。問題は、いかなるやり方を採用すれば、現代英語の実相を反映するバラ
ンスを考えることが可能になるのか?という点です。
そこで、お尋ねしたいのは、BNCのコーパスの構成が、いかなる点で「現代英語の実
相」を反映しているといえるのか、どなたかご教示願えればと思います。例えば、書
き言葉の著者のうち、男性は3100万語、女性は1500万語となっていますが、これは
「現代英語の実相」を反映する数値でしょうか?
要するに、私が言いたいのは、完全にバランスのとれたコーパスの構築に囚われすぎ
ず、常識の範囲内で、さまざまな素材を考慮し、しかも語数が豊富なコーパスを作る
努力をしませんかというものです。
ついでにご教示願いたいのは、Brown/ LOB/ Freibur Corpusなどのサンプリングの方
法の根拠について、Kennedy(1998)にも少しばかり言及がありますが、どうも私の知
る限りでは、さしたる根拠がないように思われます。いかがでしょうか?
=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
=================================================



From: "Hiroshi Shoji" <>
Subject: [lex] RE: [lex] コーパスのネットワーク利用 {01} {01} {02}
Date: Sun, 3 Jan 1999 10:58:51 -0000

東海林@バーミンガムです。

松本先生へ

学校教職員及びその推薦する人物によるコーパス構築というアイディアは面白い
と思いますが、提供される素材を無分別にコーパスに加えていっていいのでしょ
うか?
今コーパス設計のことがこのリストでも話題になっていますが、最終的に無限に
近い拡大を目指すとしても、当初の設計がコーパスの価値の大部分を決定すると
いうのが私の考えです。

<著作権問題>
何年か前に英字新聞の記事を素材とした大学用教科書の執筆グループに参加した
ことがあります。
その時は出版元の編集部の方に著作権関係の手続きを全てしていただいたため、
私自身は具体的な手順はわかりません。
COBUILDのコーパスに関しては、Sinclair (ed.) (1987) Looking Upに多少説明
があります。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus design {01}
Date: Sun, 3 Jan 1999 12:29:51 -0000

再び東海林@バーミンガムです。

鷹家先生:

> そこで、お尋ねしたいのは、BNCのコーパスの構成が、いかなる点で「現代
> 英語の実相」を反映しているといえるのか、どなたかご教示願えればと思い
> ます。例えば、書き言葉の著者のうち、男性は3100万語、女性は1500万語と
> なっていますが、これは「現代英語の実相」を反映する数値でしょうか?

私などにお答えする力はないのですが、客観的事実と個人的な考えを述べさせて
いただければ幸いです。

Sinclair (ed.) (1987) Looking UpのCh. 1 (by Renouf) によると、Cobuild
コーパスの当初の設計において、'book authorship'に関して'75% male: 25%
female'とありますので(p. 3)、男女比は3:1ということになります。ここ
を初めて読んだ時に、当初の設計から随分偏っていたのだなと思ったものです。
鷹家先生の御紹介によると、BNCではbook authorshipの男女比は約2:1となっ
ています。これをまだ偏っていると解釈すべきかなのか、そして男女比1:1が
理想的な設計であるのかどうかという問題があります。
例えば過去10年に出版された単行本を1000冊抽出したとして、著者の男女
比はどうなっているでしょうか?
CobuildコーパスやBNCはこの種の予備調査をした上で、コーパス設計の際の男女
比を設定したのではないかと推測します。
この種の調査をせずに例えば1:1という設定をした場合、逆に「現代英語の実
相」を反映しない割合となってしまう恐れが多分にあるように思います。

須賀先生が次のようにお書きになっていらっしゃいます:

> 思いつきですが,書店などは読者の要求に敏感ですから,総合書店のどうい
> う種類の本がどのくらいのスペースを占有しているかなどを調べるのもいか
> がでしょう?

これは面白いアイディアだと思います。
このお考えにヒントを得たのですが、英語圏のベストセラーリストを何年分か集
め、著者の男女比を含め、コーパス設計の基礎資料にするという考えは如何で
しょうか?

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: "Hiroshi Suga" <>
Subject: [lex] Corpus design {02}
Date: Sun, 3 Jan 1999 22:35:48 +0900

過去何年かのベストセラーリストをもとに男女比も考えて参
考にするという東海林先生のお考えはやってみる価値がある
と思います。ベストセラーとなるとたいてい大衆小説が上位
にくると思いますが,欲しいと思う表現は「上品」な評論などで
はなく,どちらかというと「あまり上品でない」大衆小説によくで
てくるのです。(^^ゞ

正月にボーッとコーパスデザインのことを考えていたらふと
こんなことを思いつきました。

不完全ながら自前コーパスを作った経験からわかったのです
が,ある1つのコーパスを作ったら,それぞれの「部品」が
また別のコーパスに生かせるということです。例えば,20世
紀の書き言葉コーパスを作った場合,それを英米にわけます
と英米別コーパスになりますし,ジャーナリズムだけを抜き
出せば「ジャーナリズム・コーパス」の一丁出来あがりです。
だから,コーパスを作る時はこのことを考えてできるだけあと
でリサイクルできるように「モジュール化」をしておくほうがい
いと思います。

そこで思いついたのが 「Bank of English」 ならぬ
「Department store of English」 です。ちょうど,デパー
トで鶏肉200グラム,にんじん5本,などと食材を選ぶように,
「料理」に応じて必要な「食材」を必要な分量だけ取り出す
のです。どこかの会社がこうしたことをやってくれないでし
ょうか。個人でコーパスを作るとなるとこれまでのお話にも
あるように著作権がやっかいです。それらをすべてクリヤー
した安心できる「食材」を売るのです。口語コーパスは元手
がかかるので「数の子」くらい高くつきますが,ジャーナリ
ズムは比較的簡単にできるので「もやし」のように安いので
す。

つまらぬことを書いてすみません。

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"
倉敷天城高等学校   須 賀  廣
email  : 
Home Page :  http://www1.harenet.ne.jp/~suga

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"



From: 村田 年 <>
Subject: [lex] Corpus & Dictionaries {01}
Date: Mon, 04 Jan 1999 09:22:06 +0900

Corpus & Dictionaries

村田 年(千葉大)です.

東海林先生:
<どうも私は文章力に乏しく、誤解を受けてしまうことが多いようです(^_^;)。
<個人の手作りコーパスは大いに結構です(私も構築経験があります)。
<授業への利用、研究論文への利用など、非営利目的であればそれは大いに活用で
<きるでしょう。
<私が問題にしているのは、村田先生がお考えのような「英和辞典編集のための
<コーパス」を個人で構築できるのか、という点です。

(村田)もちろん「英和辞典編集のためのコーパスを個人で」と申し
ているのです.他の目的であれば最初から私はそれはそれでいい,と
いう考えですから.鷹家先生の発言などを伺うと英和辞典でもまず最
初はそう構えなくてもいいかも,と思い直した次第です.(誤解はし
てないわけです.)

浜 口 様:
<>(村田)「高速化」の点で,それほどの違いがあるわけですか.
<
<だってCPUのクロック数だけ見ても、私の保有する物は16MHzと33MHz。それに対
<して最近のPCは400MHzもありですから(^_^;)それにCPUのアーキテクチャの変更
<に伴う速度向上も無視できませんし、HDDは容量が大きくなれば速くなる傾向が
<あります。グラフィックもかなり速くなってきているし。10倍どころか少なく
<とも100倍くらいは速くなっているとおもっています。

(村田)現在の私のパソコンより100倍速くなれば,速度はもう気に
しません.そうすると統計資料のプログラムさえ用意すれば2億語ぐら
いまではOK でしょう.次にはそのパソコンとハードデイスクの値段です
ね.一般の執筆者にも用意できるかというと...問題ですねー.
100倍速い400MHz のパソコンはいくらぐらいするんでしょうか?2億語を
収録するハードデイスクも高いでしょうね.

浜 口 様:
<簡単に使えるようにするというのも一つの目標なんで、そういう方にこそ人柱に
<なっていただけるとありがたいのですが(^_^;)

(村田)なかなか新しいことに挑戦できなくて,今年はいろいろやって
若返りますか.

鷹家先生:
<私は、バランスのとれたコーパスの価値を貶めるつもりはありませ
<ん。問題は、いかなるやり方を採用すれば、現代英語の実相を反映
<するバランスを考えることが可能になるのか?という点です。
<そこで、お尋ねしたいのは、BNCのコーパスの構成が、いかなる点
<で「現代英語の実相」を反映しているといえるのか、どなたかご教
<示願えればと思います。

(村田)BNC の構成もそれほど根拠があるとは言えない,といった趣
旨の(少し言い過ぎですか),ご説明を読んで,目から鱗が,の気持
です.現状ではもっとも優れたバランスのある構成で,われわれが参
考にすべき第1のものかと思っていましたので.

ただこのバランスは常に考えないといけないと思っているのは,これ
はまあいいとなると安易にはしって,1つのテクストを長いもの
でも全部同一コーパスに取り込んでしまうことが起こりがちですので,
同一テクストは何語までといった歯止めは考えていらっしゃるわけで
すね.この歯止めは鷹家先生の2000万語のコーパスではどうされたの
でしょうか.



From: "Hideshi TAKAIE" <>
Subject: [lex] Corpus の構成について {01}
Date: Mon, 4 Jan 1999 10:45:14 +0900

村田先生
@
>次にはそのパソコンとハードデイスクの値段です
>ね.一般の執筆者にも用意できるかというと...問題ですねー.
>100倍速い400MHz のパソコンはいくらぐらいするんでしょうか?2億語>を収録する
ハードデイスクも高いでしょうね.

実は、年末にGatewayのコンピューターを購入しました。Pentium II 400MHzで10ギガ
ハードデイスク、128MBメモリー、17インチDisplay付で28万円でした。約2000万
語で139MBですから、単純計算で13,900MBということは1.39ギガバイトです
ね。内臓ハードデイスクはもとより、外付けハードデイスクでも2〜3万も出せば十
分ではないでしょうか?(どうも、宣伝くさくなりました。宣伝費はもらっておりま
せんが)

A
>(村田)BNC の構成もそれほど根拠があるとは言えない,といった趣
>旨の(少し言い過ぎですか),ご説明を読んで,目から鱗が,の気持
>です.現状ではもっとも優れたバランスのある構成で,われわれが参
>考にすべき第1のものかと思っていましたので.

「最も、参考にすべきもの」であることは間違いありません。これだけ、素材につい
て詳しい情報付なのですから。問題は、いかなる根拠で、「実相を反映しているとい
えるか」という点です。ちなみに、バーミンガムコレクション(BOEの前身)当初の
構想では、「ベストセラーリスト、British Councilなどの貸し出し図書一覧」など
も参考にして書き言葉を選んでいます。ちなみにさいだい7万語の長さにしているよ
うです。須賀先生がおっしゃる「モジュール化」が可能なのは、BNCの方ですね。こ
れ以上拡大しないはずのBNCが実は部品交換が最もやりやすいというのは面白いです
ね。

B
>1つのテクストを長いものでも全部同一コーパスに取り込んでしまうこと>が起こり
がちですので,同一テクストは何語までといった歯止めは考え>ていらっしゃるわけ
ですね.この歯止めは鷹家先生の2000万語のコー>パスではどうされたのでしょう
か.

初期のころは、デザインを考慮しなかったために、版権切れの作品なら1作品全部取
り込みました。ただ、英米バランスは配慮しました。ジャーナリズム系列も英米バラ
ンスのみを配慮して取り込みました。一昨年前から、山陽学園の能登原先生と協力し
て「山陽コーパス」を作っていますが、ここでは、最初のページから約100ページ
分を英米各100万語、最終ページからさかのぼって約100ページ分を英米各10
0万語収集しています。経験上、ブラウンの2000語では素材の特徴が発揮できな
いように思われたからです。そうすると、本のフォントにもよりますが、4〜5万語
ずつになるようです。
=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
=================================================



From: "Matumoto Yosihito" <>
Subject: [lex] RE: [lex] RE: [lex] コーパスのネ {01}ットワーク利用 {01} {01} {02}
Date: Mon, 4 Jan 1999 11:35:26 +0900

東海林先生,須賀先生,佐賀の松本です。

東海林先生
>学校教職員及びその推薦する人物によるコーパス構築というアイディアは
>面白いと思いますが、提供される素材を無分別にコーパスに加えていって
>いいのでしょうか?

そこもお知恵を拝借したいところです。もちろん「適当」に作るのではなく,議論の
上,参加者の賛同を得られたと判断できた時点でコーパスに加えて行くべきだと考え
ています。まずは議論から脱却し,行動してみることが大切ではないかな,と考えて
います。

>今コーパス設計のことがこのリストでも話題になっていますが、最終的に
>無限に近い拡大を目指すとしても、当初の設計がコーパスの価値の大部
>分を決定するというのが私の考えです。

私もそう思います。それでも実際はじめてみないと,思いの外,難しい点や簡単な点
がはっきりしないと思います。そこで,オープンな環境で問題点等を整理していけな
いものかと考えたわけです。

須賀先生
>ある1つのコーパスを作ったら,それぞれの「部品」が
>また別のコーパスに生かせるということです。例えば,20世
>紀の書き言葉コーパスを作った場合,それを英米にわけます
>と英米別コーパスになりますし,ジャーナリズムだけを抜き
>出せば「ジャーナリズム・コーパス」の一丁出来あがりです。
>だから,コーパスを作る時はこのことを考えてできるだけあと
>でリサイクルできるように「モジュール化」をしておくほうがい
>いと思います。

こういった具体的な設計は,やはりやってみないと分からないと思います。

>どこかの会社がこうしたことをやってくれないでしょうか。
>個人でコーパスを作るとなるとこれまでのお話にもある
><ように著作権がやっかいです。それらをすべてクリヤー
>した安心できる「食材」を売るのです。

たぶん人任せだと景気が良くなるのを待つしかないような気がします。それこそ村田
先生がおっしゃられたように,実際世に出てくるのが10年後などといったことにな
るかもしれません。

やはり「売る」のではなくフリーで全員の知恵を出し合って作る方向が良いと思うの
ですがいかがでしょうか。そしてそこで培われたノウハウを出版社に利用してもらう
方が良いと思うのです。



From: (SATO Hiroaki)
Subject: [lex] Corpus & Dictionaries {05}
Date: Mon, 4 Jan 1999 12:51:20 +0900

At 1:57 AM 99.1.1 +0000, Hiroshi Shoji wrote:
>日本で独自に英語コーパスを作る場合、英米比、書き言葉/話し言葉比など、議
>論すべきポイントは多々あると思います。
>Bill GatesやRupert Murdockのような大金持ちが日本の英語辞典のためのコーパ
>ス作成資金を投資してくれないでしょうか(^_^;)?
>(Gatesは投資しても利益を独占しそうな雰囲気ですね。NODEでMurdock2を引い
>たら、なんとこの方はHarperCollinsも所有していらっしゃいました。COBUILDの
>金銭的現状を見ると、こちらもあまり期待できないかも(^_^;)。)
現在利用可能な研究費としては,「文部省科学研究費補助金研究成果公開促進費(デー
タベース等)」がいいと思います。一般の科研費の上限は,5000万円だと思いま
すが,「公開促進費」の方は上限がないので,大きな予算が申請できます。しかも,
「公開促進費」の採択率は,一般の科研費の採択率よりも高かったと思います。この
研究費の費目には,「著作物使用料」が認められています。

申請書のポイントは,「作成の意義等(1-3)」の部分だと思います。皆さんのこれま
での意見を短くまとめて書けば:

(1)学術研究上の意義(全国の関係研究者からの期待・要請を含め)
 BNCに足りない,米語,口語の部分を強化したコーパス作成,著作権問題を解決し
て,インターネット上に公開。
(2)我が国独自にこのデータベースを作成する理由
 学習用英和辞書の基礎資料の充実のため
(3)応募組織(?)が作成に当たる理由
 コーパス言語学,辞書学,コンピュータ言語学の専門家の共同作業が必要なため

学習辞典にも活用できるコーパス構築であれば,英語教育に力を入れようとしている
文部省は絶対に力を貸してくれると思います。

私が研究代表者として提出した計画調書が:
 http://www.senshu-u.ac.jp/~thc0408/CCDBF/html/monbusho.html
にあります。
___________________
(SATO Hiroaki)
http://www.senshu-u.ac.jp/~thc0408/
〒214-8580 専修大学8号館8411研究室
佐藤弘明 専修大学・商学部・助教授(英語)



From: "Matumoto Yosihito" <>
Subject: [lex] Corpus & Dictionaries {02}
Date: Mon, 4 Jan 1999 14:58:50 +0900

村田先生,みなさまあけましておめでとうございます。佐賀の松本です。

>(村田)現在の私のパソコンより100倍速くなれば,速度はもう気に
>しません.そうすると統計資料のプログラムさえ用意すれば2億語ぐら
>いまではOK でしょう.次にはそのパソコンとハードデイスクの値段です
>ね.一般の執筆者にも用意できるかというと...問題ですねー.
>100倍速い400MHz のパソコンはいくらぐらいするんでしょうか?2億語を
>収録するハードデイスクも高いでしょうね.

フリージアコンピュータが一番安いと思います。
http://www/freesia.co.jp/
Celeron333Aプロセッサに96MBのメモリ,4.3GBのハードディスク(システムの
大きさにもよりますが5億語分以上の記憶容量です),56KbpsFAX MODEM,32倍速
CD-ROMドライブ,それに17インチモニタが付いているFJ-333C, Bモジュール+
17インチモニタ タイプでなんと15万7600円です。

ただ,WINDOWS はオプション(\15,000)です。手持ちのコンピュータを廃棄する場
合は手持ちのシステムをそのまま使えますので15万円台で高速のマシンが買えま
す。

しかも \2,800 出して友の会会員になると,14ヶ月後には現在の最高速CPU,
PentiumU450MH に無償グレードアップもしてくれます(^_^)。



From: "Matumoto Yosihito" <>
Subject: [lex] Corpus & Dictionaries {03}
Date: Mon, 4 Jan 1999 15:10:04 +0900

佐賀の松本@自己レスです。

>フリージアコンピュータが一番安いと思います。
>http://www/freesia.co.jp/ ←誤り

http://www.freesia.co.jp/

に訂正ください。≦(__)≧



From:
Subject: [lex] Corpus & Dictionaries {02}
Date: Mon, 04 Jan 1999 22:22:49 +0900

>100倍速い400MHz のパソコンはいくらぐらいするんでしょうか?2億語を
>収録するハードデイスクも高いでしょうね.

悲しいことに私の今使ってるパソコンの値段より安いです(;_;)

ハードディスクは1語の平均長さが5文字として、2億語なら10億バイト。
10億バイト≒1Gバイト、ということですが、今時こんな「小さな」ハードディ
スクなんて、探すのが大変です(^_^;)

--
= 神戸在住の 浜口 崇(HAMAGUCHI Takashi) =
=[ http://www2d.biglobe.ne.jp/~htakashi/ ] ==



From: 磐崎 弘貞 <>
Subject: [lex] コーパスの語数 {01}
Date: Tue, 05 Jan 1999 09:36:30 +0900

> ハードディスクは1語の平均長さが5文字として、2億語なら10億バイト。

バーミンガム(そしておそらく他でも)単語1つが8文字として
コーパスの語数を計算しているようです。

磐崎弘貞@筑波大学



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {06}
Date: Tue, 5 Jan 1999 01:05:58 -0000

東海林@バーミンガムです。

初夢から覚めたら夢は手の届きそうなところに…という期待が膨らんでいます。

佐藤先生:

> 現在利用可能な研究費としては,「文部省科学研究費補助金研究成果公開促
> 進費(データベース等)」がいいと思います。一般の科研費の上限は,50
> 00万円だと思いますが,「公開促進費」の方は上限がないので,大きな予
> 算が申請できます。しかも,「公開促進費」の採択率は,一般の科研費の採
> 択率よりも高かったと思います。この研究費の費目には,「著作物使用料」
> が認められています。

私はこれは申請する価値が十分にあると思うのですが、他の先生方はどうお考え
でしょうか?

> (1)学術研究上の意義(全国の関係研究者からの期待・要請を含め)
>  BNCに足りない,米語,口語の部分を強化したコーパス作成,著作権問題
> を解決して,インターネット上に公開。

BNCよりも規模の大きいBank of Englishでも米語・口語は不足していることもア
ピール材料になるでしょう(イギリス英語以外の厳密な意味での口語がゼロであ
ることなど)。
インターネット上にどこまで公開するか(完全公開or部分公開)の議論は、後々
でもいいのですよね?

> (2)我が国独自にこのデータベースを作成する理由
>  学習用英和辞書の基礎資料の充実のため

「発信用情報記述の充実」という観点からは、「和英辞典」を含めてもいいかも
しれません。(「コロケーション辞典」も?)

> (3)応募組織(?)が作成に当たる理由
>  コーパス言語学,辞書学,コンピュータ言語学の専門家の共同作業が必要
> なため

文部省が「メーリング・リスト」を「組織」と解釈してくれるかという問題があ
るような気がしますが、このあたりはどうなのでしょうか?
現実には有志の共同研究という形になるのでしょうか?

> 学習辞典にも活用できるコーパス構築であれば,英語教育に力を入れようと
> している文部省は絶対に力を貸してくれると思います。

力強いお言葉で、様々な垣根を越えたコーパス構築という、本当に遠い先の夢と
しか思っていなかったことができるかもしれないと感じ始めています。

> 私が研究代表者として提出した計画調書が:
>  http://www.senshu-u.ac.jp/~thc0408/CCDBF/html/monbusho.htmlにあり
> ます。

早速拝見させていただきました。
日本における英語辞書作成のためのコーパス作成プロジェクトに賛成の方が他に
も何人か出たとしたら、議論を進めて計画調書の内容も詰めていけばいいので
しょうね。

大規模な共同研究は経験がないので、佐藤先生の情報は大変参考になりました。
他の先生方の御意見も是非お聞きしたいところです。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: (NAKAYAMA Hitoshi)
Subject: [lex] Y2K {01}
Date: Tue, 5 Jan 1999 10:22:16 +0900

中山仁@茨城高専 です。お聞きしたいことがあります。

知人から次のような質問を受けました:

ところでCNNの記事で2000年問題について,
The year 2000 or "Y2K" problem, also known as the millennium bug, stems
from an old programming shortcut.
なる一節があり,Y2Kに引っかかりました。2000年だから YEAR-TWO-KILO 
に近い記述なのかと思うのですが本当のところ何なのか。どう読むのか。調べてもら
えるとありがたく思います。

どなたかご教示願います。

************************
中山 仁

茨城工業高等専門学校 一般科目



From: kazuo kato <>
Subject: [lex] Y2K {02}
Date: Tue, 05 Jan 1999 10:55:44 +0900

加藤@岩手医大です.

"Y2K" は > The year 2000> = "the Year Two Thousand" だと思っていまし
たが,...
”YEAR-TWO-KILO”は聞いたことがないような気がします.

NAKAYAMA Hitoshi wrote:
>
> 中山仁@茨城高専 です。お聞きしたいことがあります。
>
> 知人から次のような質問を受けました:
>
> ところでCNNの記事で2000年問題について,
> The year 2000 or "Y2K" problem, also known as the millennium bug, stems
> from an old programming shortcut.
> なる一節があり,Y2Kに引っかかりました。2000年だから YEAR-TWO-KILO 
> に近い記述なのかと思うのですが本当のところ何なのか。どう読むのか。調べてもら
> えるとありがたく思います。
>
> どなたかご教示願います。
>
> ************************
> 中山 仁
>
> 茨城工業高等専門学校 一般科目



From: kazuo kato <>
Subject: [lex] ビンディング {01}
Date: Tue, 05 Jan 1999 11:06:57 +0900

加藤@岩手医大です.

スキー用具のビンディングですが,『大日本国語辞典』などの小学館の国語辞
典はこれを「スキー靴にスキーを取り付けるための締め具」と定義しています.
私はこれに抵抗を感じる者の一人で,「スキーにスキー靴を」とすべきではな
いかと思うのですが,みなさまはどう思われますか.

『学研国語大辞典』『大辞林』『デイリーコンサイス国語辞典』『集英社国語
辞典』などは私の語感を支持してくれています.



From: 村田 年 <>
Subject: [lex] Corpus & Dictionaries {01}
Date: Tue, 05 Jan 1999 12:05:04 +0900

パソコンの能力と値段について

村田 年(千葉大)です.

鷹家,浜口,松本の諸先生にお教えいただきましてありがとうござ
います.何も知らない初級の者の質問ですが,丁寧にお答えいただ
き感謝致します.
中級から初級の方々は黙って読むだけの方も多いようですが,私な
どが質問したために参考になることも多いかと,自分の存在を正当
化しております.

佐藤先生が書かれている科研費の公開促進費ですが,これも厳しく
なっているようです.1件名前だけ出させていただいている申請が
ありますが,何年か続けてやらないといけないでしょう.具体的な
申請はどこかの大学からの方がいいかも知れません.



From: Nagayuki Inoue <>
Subject: [lex] Statistics in lexicography {02}
Date: Tue, 05 Jan 1999 12:07:14 +0900

東海林先生

> > 井上先生によると c-score というのもあるのですか?
>
> c-scoreというのは私は存じません(井上先生にお教え願えれば幸いです)。
> 次の文献では、共起の統計分析としてz-scoreという方式も紹介されています。

以前紹介しました

Baugh, S., A. Harley and S. Jellis (1996) "The Role of Corpora in
Compiling the Cambridge International Dictionary of English."
International Journal of Corpus Linguistics 1:1, pp. 39-59.

でふれられていますが,CIDEの編集に際してMI-scoreに代わるものとして利用さ
れた統計値ということです。私も詳しいことは知りません。

WordSmith ToolsでもMI-scoreがサポートされるようになるようです。
〔cf. 11 Dec., 1998バージョン〕

**********************井上永幸 <>*********************
[辞書学MLログを公開中: http://lexis.edu.shimane-u.ac.jp/inoue/ml_log.html]
--辞書学ML脱会は宛てにsignoff lexと送る--



From: "Matumoto Yosihito" <>
Subject: [lex] Corpus & Dictionaries {07}
Date: Tue, 5 Jan 1999 13:40:52 +0900

佐賀の松本です。

東海林先生
>初夢から覚めたら夢は手の届きそうなところに…という期待が膨らんで
>います。
>私はこれは申請する価値が十分にあると思うのですが、他の先生方は
>どうお考えでしょうか?

賛成です(^_^)。

>> 学習辞典にも活用できるコーパス構築であれば,英語教育に力を入れようと
>> している文部省は絶対に力を貸してくれると思います。
>
>力強いお言葉で、様々な垣根を越えたコーパス構築という、本当に遠い先の夢と
>しか思っていなかったことができるかもしれないと感じ始めています。

問題は,村田先生からご指摘いただいた

|科研費の公開促進費ですが,これも厳しくなっているようです.
|1件名前だけ出させていただいている申請がありますが,
|何年か続けてやらないといけないでしょう.

です。でも,ワクワクするような話で,新年早々明るい気分になっています。

>> 私が研究代表者として提出した計画調書が:
>>  http://www.senshu-u.ac.jp/~thc0408/CCDBF/html/monbusho.htmlにあり
>> ます。
>
>早速拝見させていただきました。
>日本における英語辞書作成のためのコーパス作成プロジェクトに賛成の方が他に
>も何人か出たとしたら、議論を進めて計画調書の内容も詰めていけばいいので
>しょうね。
>
>大規模な共同研究は経験がないので、佐藤先生の情報は大変参考になりました。
>他の先生方の御意見も是非お聞きしたいところです。

お役に立てるかどうか分かりませんが,塾を閉じてでも(^_^;)やってみたいと思って
います。



From: Hirosada IWASAKI <>
Subject: [lex] アクティブジーニ {01}アス英和 {01}
Date: Tue, 05 Jan 1999 13:42:36 +0900

飯塚さんへ、

遅くなりましたが、昨年末、アクティブジーニアスに関する質問に
お答えいただき、ありがとうございました。

>  収録語句の数ですが,ホームページのデータは万の位の5が抜け
> ておりまして失礼しました(訂正するよう指示しました)。正しく
> は54,300で,内訳は,普通の見出し40,000,成句7,000,準成句7,3
> 00です。『フレッシュ』は55,000ですから,少し少なくなっていま

なるほど、語数、および記述内容からすると、『フレッシュ』の下
位になるものだが、事実上の後継版というわけですね。

> 『フ
> レッシュ』は活版(古典的な鉛の活字)で作られているのですが,
> 印刷所では活版の組版をやめつつあるために,従来の方法での改訂
> が難しくなったという事情もあります。

このあたりも印刷技術の進歩を見る思いです。何気なく使う辞書の
紙質についても、より薄く、より破れにくく、かつ、文字がにじま
ないものがどんどん開発されていると聞きます。おそらくは『アク
ティブ』にもそうした技術が生かされているものと想像します。

なお、この紙質について、海外の、特にペーパーバック辞書は結構
無頓着ですよね。もちろん、コストの関係でしょうが。でも日本の
ユーザーは気にするようで、多少高くなっても、 Chambersの辞書の
ように、紙質をよくして日本版を出す必要が出てくるのでしょう。

磐崎弘貞

=============================================================
Hirosada IWASAKI
OFFICE: University of Tsukuba, Foreign Language Center
Tennodai 1-1-1, Tsukuba-shi, Ibaraki 305-8577 Japan
(TEL: +81-(0)298-53-4189/2430, FAX:+81-(0)298-53-6616)
HOME TEL/FAX: +81-(0)298-51-1684
E-mail:

=============================================================



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus design {03}
Date: Tue, 5 Jan 1999 09:42:37 -0000

東海林@バーミンガムです。

Tue, 28 Jul 1998 01:29:52 +0100に、速報TALC98 {1}の中で私は次のように書
きました:

> TALC98はBNC陣営の大会と言っても言い過ぎではないでしょう。
> サイト(http://users.ox.ac.uk/~talc98/)にBNCへのリンクが張ってある
> ことからも明らかです。
> その大会にJeremyがguest speakerとして招かれたのにはほっとするものが
> あります。
> 磐崎先生が『言語』にお書きになっている文章からも明らかなように、彼は
> 「BOEとBNC両方に関わった唯一の人物」です。Workshopの中でも、BNCの設
> 計段階において「smoky roomの中で議論に議論を重ねた挙句、何とか妥協が
> 成立した」という裏話も語っておりました(コーパスの「設計」が如何に大
> 事か、再認識させられました)。

最近「設計は特に気にせずに、まずは走り出せばいい」という意見が見受けられ
ますが、少なくとも設計の根幹部分を議論してから構築を始めないと、本当の意
味で日本の英語辞典編集の基礎資料となるコーパスにはならない恐れがあるので
はないでしょうか。

須賀先生のDepartment Store of Englishはとても面白いアイディアだと思いま
す。
デパートの建物を作る時でも、それぞれの売り場の面積をあらかじめ決めるのだ
ろうと思います。
もちろん、建物完成後に店舗の入れ替わりはあるのですから、売り場面積は変更
の利かないものというわけではないでしょう。

文部省に科研費を申請するという素晴らしいアイディアも、corpus designの問
題と連動させて議論する必要を感じております。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: Minoru Moriguchi <>
Subject: [lex] Corpus & Dictionaries {07}
Date: Wed, 06 Jan 1999 11:22:27 +0900

シャープ・森口です。
コーパス作成のために文部省の科研費を申請するお話が出ていますが、
それについて参考になればと思いコメント致します。

私は現在アジア太平洋機械翻訳協会(AAMT)の市場動向調査委員会と
いう会合に参加しております。ご承知のように、機械翻訳においても
コーパスは非常に重要な役割を持っており、先日の委員会でも機械翻訳用
専門用語辞書を作成するためのコーパスの話が出ましたし、機関誌でも
コーパスの必要性に触れております。そこで、一つの提案ですが、
このML(または辞書研等の具体的な組織)と機械翻訳協会の間で
何らかの協力関係を持てば日本の言語データの整備のためにも有効
であり、文部省を動かす方向に向かうことはできないでしょうか。

もちろん機械翻訳用の辞書と人間の学習用の辞書では、求めるべきコーパス
の方向性が異なるので、実際の作業をどうするかという大問題は
あります。しかしながら、逆にもしどちらかがコーパス作成のために
文部省から費用を得た場合、もう一方が、同様のコーパス(言語の
専門家以外には違いが見えない可能性が考えられます)に、予算を
得るのはむつかしくなるとも考えられます。

以上、僭越とは思いますが、コメントさせて頂きました。
参考までに、アジア太平洋機械翻訳協会(AAMT)のHPは以下です。
http://www.jeida.or.jp/aamt/index-j.html

--
Minoru Moriguchi
Technical Communicator
Personal Computer Division
SHARP Corporation



From: "Matumoto Yosihito" <>
Subject: [lex] Corpus design {04}
Date: Wed, 6 Jan 1999 11:34:23 +0900

東海林先生おはようございます。佐賀の松本です。

>最近「設計は特に気にせずに、まずは走り出せばいい」という意見が見受け
>られますが、少なくとも設計の根幹部分を議論してから構築を始めないと、
>本当の意味で日本の英語辞典編集の基礎資料となるコーパスにはならない
>恐れがあるのではないでしょうか。

というのは,この部分のことかと思いますので,少し考えを述べたいと思います。

東海林先生
>>学校教職員及びその推薦する人物によるコーパス構築という
>>アイディアは面白いと思いますが、提供される素材を無分別に
>>コーパスに加えていっていいのでしょうか?

松本
>そこもお知恵を拝借したいところです。もちろん「適当」に作るのではなく,
>議論の上,参加者の賛同を得られたと判断できた時点でコーパスに加え
>て行くべきだと考えています。まずは議論から脱却し,行動してみることが
>大切ではないかな,と考えています。

私がここで言いたかったのは,「設計の根幹部分を無視してでも走りはじめる」とい
うことではありません。優先順位として,現実的に構築できるかどうかの方が上では
ないか,ということです。現時点でどんなに完璧な計画を立てても,現実の行動に結
びつかなかった場合,次回に生かせる教訓は得られないからです。おそらくはまた設
計からやり直しです。

というのは,コンピュータの性能はこれからも上がり続け,今年中には64ビット1
GHの高性能高速CPUを搭載したパソコンが登場し,現在の最高速マシンの10倍
程度早くなるといわれています。今でもコーパスが登場したときに比べると100倍
以上のスピードがあるわけで,またさらに高速化が進めば設計に大きな影響を与える
ことは間違いありません。

そこで,「設計止まり」の議論を行うよりも,少しでも現実にコーパスを構築できそ
うな内容で議論を進めた方が良いのではないか,という趣旨でした。もちろんその中
には徹底的な「設計の根幹部分」の議論も含まれます。が,そこで止まるべきではな
い,という考えです。

>>文部省に科研費を申請するという素晴らしいアイディアも、corpus designの
>>問題と連動させて議論する必要を感じております。

おっしゃるとおりで,corpus design がないとコーパス自体の意味(先生方に使って
いただけないようなコーパスであれば,作る意味など全くないことは,初心者ですが
分かっているつもりです)がありませんから,優先順位として高い位置にもってくる
べきだと思います。この点を否定するものではありません。



From: 村田 年 <>
Subject: [lex] Y2K {01}
Date: Wed, 06 Jan 1999 19:13:09 +0900

       "Y2K"の読み方は?

村田 年(千葉大)です.

加藤先生:
<加藤@岩手医大です.
<"Y2K" は > The year 2000> = "the Year Two Thousand" だと思っていまし
<たが,...
<”YEAR-TWO-KILO”は聞いたことがないような気がします.

今日の The Daily Yomiuri のトップ記事の見出しも Fears over early
Y2K bug glitches prove unfounded となっていて,新聞にはよく出てい
るようですが,意味はいいとして読み方も 'the year two thousand' と
なるのでしょうか.不勉強で聞いたことがないので教えてくれませんで
しょうか.[wai tu: kei]とは読まないのでしょうか.

『プログレッシブ英和』3版に出ていますが,読みがありません.



From: "Hiroshi Suga" <>
Subject: [lex] Y2K {02}
Date: Wed, 6 Jan 1999 21:39:02 +0900

村田先生,須賀(倉敷天城高校)です。

>なるのでしょうか.不勉強で聞いたことがないので教えてくれませんで
>しょうか.[wai tu: kei]とは読まないのでしょうか.

村田先生のおっしゃるとおり確かに [wai tu: kei] 言っています。
つぎのHPを覗いてみてください。(real audio使用)

http://www.y2kupdatereport.com/#pastprograms

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"
倉敷天城高等学校   須 賀  廣
email  : 
Home Page :  http://www1.harenet.ne.jp/~suga

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"



From: "Hideshi TAKAIE" <>
Subject: [lex] Y2K {03}
Date: Wed, 6 Jan 1999 23:31:18 +0900

-----Original Message-----
差出人 : Hiroshi Suga <>
宛先 : lex List Member <>
日時 : 1999年1月6日 21:43
件名 : [lex] Y2K {02}

>村田先生,須賀(倉敷天城高校)です。
>今日の The Daily Yomiuri のトップ記事の見出しも Fears over early
Y2K bug glitches prove unfounded となっていて,新聞にはよく出てい
るようですが,意味はいいとして読み方も 'the year two thousand' と
なるのでしょうか.不勉強で聞いたことがないので教えてくれませんで
しょうか.[wai tu: kei]とは読まないのでしょうか.
>>なるのでしょうか.不勉強で聞いたことがないので教えてくれませんで
>>しょうか.[wai tu: kei]とは読まないのでしょうか.
>村田先生のおっしゃるとおり確かに [wai tu: kei] 言っています。

WWWebster Dictionary On the Webに以下の説明があります。
1 a : the 11th letter of the English alphabet b : a graphic representation
of this letter c : a speech counterpart of orthographic k
2 : a graphic device for reproducing the letter k
3 : one designated k especially as the 11th in order or class
4 : something shaped like the letter K
5 : a unit vector parallel to the z-axis
6 [kilo-] : THOUSAND <a salary of $24K> ★ここです。"a salary of 24
thousand dollars "としか読めませんね。

すると[wai tu: kei] と読み (the) year two thousand の略なのでしょうか?

=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
=================================================



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus & Dictionaries {08}
Date: Wed, 6 Jan 1999 14:55:12 -0000

東海林@バーミンガムです。

シャープ・森口様のコメントを大変興味深く拝見致しました。

> もちろん機械翻訳用の辞書と人間の学習用の辞書では、求めるべきコーパス
> の方向性が異なるので、実際の作業をどうするかという大問題はあります。

須賀先生のコメントにあったコーパスの「モジュール化」による解決という方法
が考えられるかもしれません。

それぞれの組織で、ある程度別々に作業を進めるにしても、最初の話し合いによ
りコーパスの全体構成と共通フォーマットをしっかりと策定しておけば何とかな
りそうにも思います。

と、書いてはみたものの、現実にそう簡単に事が進むかどうかは、私には全くわ
かりません(^_^;)。

いずれにせよ、「日本製英語コーパス」が初夢に終わらないことを強く願ってい
ます。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: 南出 康世 <>
Subject: [lex] National Geographic CD-Rom {01}
Date: Thu, 07 Jan 1999 00:01:40 +0900

 おめでとうございます。しばらく家を留守にしていたらメールが山
のようにたまっていました。lex のメールはコーパスに関するものが
多いですね。ご高説はゆっくり伺うことにして、標記の件、かなり前
にまとめていたものですが、そのままになっていましたのでご報告し
ます。
 まず、National Geographic CD-ROMの概要を述べておきます。
このCD-ROMに収められているのはNational Geographicの創刊号
(1881年1月号)から1996年12月号までの100年分 (ペ
ージにして188500ページ分です)。National Geographicの英
語はくせがなく英語コーパスとして最適ですが、残念ながら浅田さん
が心配しておられるように全て画像データです(絵は鮮明ですが、文
字の鮮明度は落ちます。読むより見るコーパスといってよいでしょう)。
ただしトピック検索機能が付いているので、検索はできます。たとえば、
"nojima" で検索すると野島断層(the Nojima Fault)をトピックとして
扱っている記事名と年月号とページ数が一覧されますのでそのページを
あければ必要な情報は得られます。自然、地理、動植物などに関心のあ
る人には有用なコーパスです。このトピック検索を利用してフルテクス
ト検索に相当する検索が可能です。たとえば、"that" で検索すると44
39ヒットします。しかしこの後が大変で一覧表示されている該当ページ
をいちいち開いて行かねばなりません。当該ページを開いてもthat が反
転表示されているわけでないので、そのページを始めから終わりまで読む
必要があります。また一枚のCD-ROMに100年分が収められているので
なく、30枚に分散されているので何度もCD-ROMを入れ替える必要があ
ります。4439例からthatの用法を探ろうとする試みは断念せざるを得
なくなります。ということで言語コーパスとしては不適ということになり
ます。もっとも頻度数値だけでも意味をなす場合はそれなりに使えます。
たとえば、toward (196)/towards(3), should (188)/ ought to (0),
around(3422)/ round (578)などアメリカ英語の特徴の一端を示す数
値といえるでしょう。
 検索機能は上記の他、ワイルドカード検索、AND/OR/NOT/WITHOUT
検索を備え、さらにADJx検索、NEARx検索といった上級検索機能も備えて
います。テキストデータであればという気持ちがいっそう強くなります。
 このCD-ROMには貴重なおまけがあります。それはこの100年間,
National Geographicに掲載された広告の全てが画像ごと別途検索できる
ということです。広告英語に関心のある人にとっては極めて貴重なコーパ
スということになります。これについて面白いデータが得られればまたご
報告します。

〓∵〓南出康世 〓∵〓
[電話0743-75-7050. FAX 0743-75-7050]
[e-mail ]



From: "Hiroshi Shoji" <>
Subject: [lex] Corpus design {05}
Date: Wed, 6 Jan 1999 18:36:57 -0000

東海林@バーミンガムです。

松本先生:

> 私がここで言いたかったのは,「設計の根幹部分を無視してでも走りはじめ
> る」ということではありません。優先順位として,現実的に構築できるかど
> うかの方が上ではないか,ということです。現時点でどんなに完璧な計画を
> 立てても,現実の行動に結びつかなかった場合,次回に生かせる教訓は得ら
> れないからです。おそらくはまた設計からやり直しです。

コーパスの設計には様々なレベルがあると思います。

1.全体の(目標)サイズ
2.地域別比
3.Written / Spoken 比
4.ジャンル別比
5.男女比
6.素材収集方法
7.素材入力方法
8.タグの有無、(付けるとすれば)タグの内容

他にも細部にわたってたくさんあると思いますが、「根幹の根幹部分」は1から
3あたりでしょうか。
私が「根幹部分の議論が必要」と言ったのは、構築が現実にスタートしてから議
論をするのは本末転倒だと思ったからです。

> 今でもコーパスが登場したときに比べると100倍以上のスピードがあるわ
> けで,またさらに高速化が進めば設計に大きな影響を与えることは間違いあ
> りません。

「コンピュータのスピードがコーパスの設計に影響を与える」と言う場合、量の
部分と質の部分とに分けて考えなければならないと思います。
量の部分に関して言えば、確かにより大きなデータをより高速に処理できるよう
になるわけですから、サイズの部分に関する設計に影響を与えることもあると言
えそうです。
質の部分に関しては、特に私が上で挙げた2−5の「比率」に関する部分など、
高速化による量の拡大を伴っても揺るがない部分だろうと思います。

結局量の部分に関しても、人間が関与する部分の時間を劇的に削減するとは限り
ませんから、当初の根幹設計が重要であると言う私の考えは、質量両面で変わり
ません。
(結果的にコンピュータの高速化により完成が早くなったとしたら、それで儲け
ものと考えるわけです(^_^;))。

補助金を得るにしても、設計がはっきりしないと、一体コーパス構築にいくらか
かるのかもよくわかりません。
British National CorpusやBank of Englishでさえ、私の知る限りでは「いくら
かかった(かかっている)のか」という部分は公表されていないようですから、
構築費用の試算をするためには大まかでも設計をするしかないでしょう。

> そこで,「設計止まり」の議論を行うよりも,少しでも現実にコーパスを構
> 築できそうな内容で議論を進めた方が良いのではないか,という趣旨でした。
> もちろんその中には徹底的な「設計の根幹部分」の議論も含まれます。が,
> そこで止まるべきではない,という考えです。

もちろん「止まるべきではない」というのは松本先生同様、私も強く感じており
ます。
あくまでも構築をスムーズにするための設計とは何か、という点に関して、ある
程度のコンセンサスを得ておく方がいいと考えた上での発言でした。

Hiroshi Shoji
<University of Birmingham, UK>
<Shion Junior College, Japan>



From: kazuo kato <>
Subject: [lex] Y2K {02}
Date: Thu, 07 Jan 1999 09:16:40 +0900

村田先生:

加藤@岩手医大です.

村田 年 wrote:
>
>        "Y2K"の読み方は?
>
> 村田 年(千葉大)です.
>
<"Y2K" は > The year 2000> = "the Year Two Thousand" だと思っていまし
> <たが,...
> <”YEAR-TWO-KILO”は聞いたことがないような気がします.
>
> 今日の The Daily Yomiuri のトップ記事の見出しも Fears over early
> Y2K bug glitches prove unfounded となっていて,新聞にはよく出てい
> るようですが,意味はいいとして読み方も 'the year two thousand' と
> なるのでしょうかD不勉強で聞いたことがないので教えてくれませんで
> しょうか.[wai tu: kei]とは読まないのでしょうか.

(加藤和男)
Y2K を [wai tu: kei] と読むのは自明のことときめこんでいたので,元の質問
の真意を取り違えていたかもしれません."the year 2,000" は "the Year
Two Thousand" としか読まず,"the year two kilo(s)" と読むことはないだろ
うというつもりでした.
私の発言が Y2K そのものが "the Year Two Thousand" と読まれるという趣
旨に解釈されたとすれば,それはことばが足りなかったためです.
どうも失礼いたしました.



From: "Asao, Kojiro" <>
Subject: [lex] Y2K {02}
Date: Thu, 07 Jan 1999 11:24:43 +0900

村田先生、

朝尾@東海大学です。

>        "Y2K"の読み方は?

> [wai tu: kei]とは読まないのでしょうか.

Gookin, D, & Gookin, S.H. (1998). Illustrated computer
dictionary fo dummies, 3rd ed. Foster City, CA: IDG Books
Worldwide.

という、読み物風のコンピュータ辞典があり、これにはコンピュー
タ用語の発音が示してあります。これに Y2K という項目があり、

Acronym for the _Year 2000 problem_, where 2K represents 2000.

とい説明があり、(wy too kay) と発音が示してあります。K はキロ
つまり、1000 ということで、コンピュータ関係では K を代用する
ことが多いようです。Gateway 2000 というコンピュータがあります。
Web ページは http://www.gw2k.com/ で、Gateway 2000 を gw2k と
示しています。

----------------------------------- phone (work): 0463-58-1211 --
朝尾幸次郎 東海大学(文学部)英文学科 ext.: 3133
fax (work): 0463-50-2239
-- http://www.lb.u-tokai.ac.jp/~koji/ ---------------------------



From: "Matumoto Yosihito" <>
Subject: [lex] Corpus design {06}
Date: Thu, 7 Jan 1999 11:29:46 +0900

東海林先生おはようございます。佐賀の松本です。

>コーパスの設計には様々なレベルがあると思います。
>
>1.全体の(目標)サイズ
>2.地域別比
>3.Written / Spoken 比
>4.ジャンル別比
>5.男女比
>6.素材収集方法
>7.素材入力方法
>8.タグの有無、(付けるとすれば)タグの内容

中略

>あくまでも構築をスムーズにするための設計とは何か、という点に関して、ある
>程度のコンセンサスを得ておく方がいいと考えた上での発言でした。

了解しました。私の言葉足らずで,誤解を招いていたようです。優先順位は必ずしも
手順の順位とは一致しないことを述べておくべきだったと反省しております。

一つ,辞書からはずれてしまうので手短に。じつは WINDOWS98 にはマルチウィンド
ウマルチタスクに加え,マルチディスプレイ機能が追加されています。まだハードが
追いついていませんが,いずれは対応機種がでてくるものと思われます。どんなこと
ができるかといえば,複数のモニターで別のコーパスを検索し,別々の画面で表示す
ることが1台のパソコンでできるようになるのです。ソフト面でもいろんな開発が進
み,例えば標準語を関西弁に変換するソフト,などというのもでてきているようで
す。



From: Minoru MURATA <>
Subject: [lex] Y2K {03}
Date: Thu, 07 Jan 1999 12:31:35 +0900

加藤和男先生,須賀先生,鷹家先生,朝尾先生

村田 年です.
ご教示ありがとうございました.
中山先生もはっきり言っていただいた方がよかったのではと思いました.

加藤先生:
> Y2K を [wai tu: kei] と読むのは自明のことときめこんでいたので,元の質問
> の真意を取り違えていたかもしれません."the year 2,000" は "the Year
> Two Thousand" としか読まず,"the year two kilo(s)" と読むことはないだろ
> うというつもりでした.



From: (SATO Hiroaki)
Subject: [lex] Corpus design {06}
Date: Thu, 7 Jan 1999 13:44:54 +0900

専修大学の佐藤弘明です。

平成9年度に認められた「文部省科学研究費補助金研究成果公開促進費(デー
タベース等)」の場合を思い出しながら,コメントをします。

At 6:36 PM 99.1.6 +0000, Hiroshi Shoji wrote:
>コーパスの設計には様々なレベルがあると思います。
>
>1.全体の(目標)サイズ
平成8年12月に文部省に提出した申請書では,映画20作品の文字・音声・映像のデー
タベースを作成する計画で3000万円の予算を要求しました。平成9年6月に内定が出
た段階で,認められた予算は1000万円になったため,登録する映画を7作品に減らし
ました。

予算の額が縮小されても,実現できるような計画が大切だと思います。

研究が計画通りにいかずに失敗し,大切な予算が無駄になる場合があります。誰が責
任をとるか? 当然,研究代表者です。研究分担者にも迷惑がかかるので,絶対に失
敗しない計画が必要です。

私が提出してきた計画は,計画段階で常に7,8割完成しており,夏休みに少し努力
すれば,次年度の3月末までは,絶対に完成できる程度の研究でした。コーパス構築
で大規模な研究費を申請する場合にも,コーパスの構築,検索プログラムの作成など
は,9割完成している状況で行った方が安全です(参加する研究者も安心です)。

ですから,
>6.素材収集方法
>7.素材入力方法
の部分は,現段階で,収集できており,入力できているデータをチェックするのが良
いと思います。

>2.地域別比
>3.Written / Spoken 比
これも,現段階で収集できており,入力できているデータのなかでどれを選択するか,
というやり方のほうが安心です。

文部省の予算では,研究参加者に対する謝礼はありません。余り無理な労働を研究分
担者に要求することはできないのです。研究分担者が予想外の雑務で忙しい場合,最
悪の状況では,研究代表者1人でも,研究成果が出せるような計画も視野に入れた方
がよいと思います。「この計画なら安心して,参加できる」と研究分担者に納得して
もらう計画で,かつ,<画期的>で<独創的>なものをひねり出すわけです。

At 6:36 PM 99.1.6 +0000, Hiroshi Shoji wrote:
>補助金を得るにしても、設計がはっきりしないと、一体コーパス構築にいくらか
>かるのかもよくわかりません。
>British National CorpusやBank of Englishでさえ、私の知る限りでは「いくら
>かかった(かかっている)のか」という部分は公表されていないようですから、
>構築費用の試算をするためには大まかでも設計をするしかないでしょう。
平成9年度の研究では,実は,この部分が結構大変でした。映画の著作権の交渉をす
る場合に,日本の20世紀フォックスに問い合わせても,彼らには権限がないので,
無駄です。

米紙『タイム』やCNNのテレビ番組のスクリプトは,インターネット上にあります。
既に,収集と入力が終わっているので,コーパス登録候補に上がります。しかし,こ
れらの著作権を処理するには,誰とどのように交渉すればよいのかが,難しいと思い
ます。

英文電子データの著作権の処理を行ってくれる代理店が日本にあると楽なのですが。
___________________
(SATO Hiroaki)
http://www.senshu-u.ac.jp/~thc0408/
〒214-8580 専修大学8号館8411研究室
佐藤弘明 専修大学・商学部・助教授(英語)



From: Minoru MURATA <>
Subject: [lex] Discourse Organiser {01}
Date: Thu, 07 Jan 1999 15:39:14 +0900

    重要な研究課題:Discourse Organisers と Modifiers

村田 年(千葉大)です.
私の「自由連結の重要性」に対して南出先生が12月24日に書かれた文章
の中にたいへん重要な研究テーマが含まれていたと思います.それは先生
が "Vocabulary 3"その他の名称で紹介している,ある種の名詞の重要な役
割についてです.この問題は一度で通り過ぎてしまうにはあまりにもった
いないものだと気になっていました.さらに先生に書き足していただくた
めにつまらないことを書きます.

南出先生:
              さてproblem には、assumption, explanation,
proposal などとともに、これまで述べてきたことをまとめる前方照応の用
法があることが指摘されています。Vocabulary 3 (Winter, 1977),
Discourse Organizing Word (McCarthy, 1991), A-noun (Bloor &
Bloor, 1994)などと呼ばれているものです。この用法ではthis を伴うのが
普通です。上のデータでthis との結合が突出しているのはこの用法を反映
しているのでしょう。第一段階の分析で一見無意味と思われる数値に
problem のcore meaning に関わる重要なてがかりが隠されていたという
ことになります。このVocabulary 3に関する情報は英和辞典に必要と思わ
れます。取り入れるとすれば、先行文の内容をthis problemで受けた用例
(かなり長いものになります)が必要になります。このことから「自由結合
の数値を示してもあまり意味がない」という主張はやや修正する必要がある
かなという気がしています。ただ、一見無意味に見える自由結合とその頻度
数にいつも有用な意味が隠されているというわけでありません。

村田:
1992年にコービルドへ行くときに持っていった課題は「自由連結の確認」と
Discourse Organiser でした.厚生委員長(この仕事が大変で旅費をもらった
感じです)と改組を理由に何の勉強もしていなかったので,Organiser がど
う研究されているかはまったく知りませんでした.さっそくフミオ
(関根文夫氏,博士課程在学中,ロイヤル英和の貢献者)に話すと
Winter(1986) と Hoey(1991) を貸してくれました.アントワネットに話したら
東海林先生が話題にされた Dzierzanowska(1985) と Hewings and
McCarthy(1988) を貸してくれました.持つべきは友達です.先行文献を
何も知らずにやってしまおうと思っていたのですから赤面のいたりです.
コーパスの頻度からこのようなデイスコース研究をやったものはないかも
知れないと思いさっそくやっつけたのが次のものです.

村田 年「Discourse Organisers と Evaluating/Locating Modifiers とのコロケー
ションの頻度調査」『言語文化論叢』第1号.千葉大学外国語センター.
1995 (1993年の日本英語表現学会第22回大会で口頭発表)

Problem --- Solution という場面を立て,そこに現れると思われる Organisers
として problem, question, cause, reason, phenomenon, fact, result, answer,
explanation を選び,一方 Organiser を規定する形容詞として,41 の形
容詞を選び,この結びつき 369通りの頻度を求め,いろいろ考察して
みました.最初の発想は単純で,談話の統括語(最重要名詞)になりやすい
名詞があるであろう.またその名詞のその場面の意味を規定・制限する形容
詞があるだろう.この組み合わせで頻度の高いものをつきとめれば英語教育
に役立つのではないか,といったものでした.

頻度においても同意語・類語を比較するといろいろと気がつくことが
多いのがわかりました.比較はまずは2語ずつやり,だんだんグルー
プを大きくしていった方がやりやすいこともわかりました.ですから
基本語についてはただ当該の語のプリントアウトした統計結果だけで
は辞書のいい原稿は書けないと思うわけです.

若い方々にこの方面の研究をお勧めしたいですね.

その後も知識は増えていません.南出先生に補っていただけると有り難
いです.コーパスを使った談話研究が増えてくることを願っています.

Winter, E. O. 1986. Clause relations as information structure: two
basic text structures in English. In Coulthard, M. (ed.) Talking
about Text: Studies Presented to David Brazil on his Retirement.
(Discourse Analysis Monographs No 13). Birmingham: English
Language Research, University of Birmingham.
Hoey, M. 1991. Patterns of Lexis in Text. Oxford: Oxford University
Press.
Hewings, M., and McCarthy, M. 1988. An alternative approach to the
analysis of text. Prazis des Neusprachlichen Unterrichts, 1.
pp.3-10.
Dzieranowska, H. and Kozlowska, C. 1985. Selected English Collocations.
Warszawa: Panstwowe Wydawnictwo Naukowe.



From: kazuo kato <>
Subject: [lex] predicate offense {01}
Date: Fri, 08 Jan 1999 10:21:49 +0900

加藤@岩手医大です.次の引用文の predicate offense についてですが:

Starr was so sure of his righteousness that he became outraged when
the story broke and people had the temerity to question his motives.
For the White House, it provided a predicate offense--the first
piece of evidence used to paint Starr as a sex-obsessed keyhole
peeper.
----Time, december 28, 1998-January 4, 1999, p. 46.

これは法律用語であると思いますが,勤務先の図書館にある『英米法辞典』
(東京大学出版会,1991)にも The Guide to American Law: Everyone's
Legal Encyclopedia (West Publishing Co., St. Paul, Minnesota, 1983),
13 vols. にもありません.
Yahoo! で検索すると判決文などが沢山出て来ますが,定義は探せませんでし
た.どなたかお心当たりがありませんか.



From: "NISHIMURA Tadamasa" <>
Subject: [lex] RE: [lex] ビンディング {01} - {01}余話
Date: Fri, 8 Jan 1999 10:32:38 +0900

スキー用具のビンディング −発音について

加藤先生の
>スキー用具のビンディングですが
で、英和辞典の発音の表記のことに思いが至りました。

ビンディング は (bind- [b'aind-」)ではなかろうか?と
思いつつ、加藤先生の話で、やっと調べてみました。

たとえば技術者が 「アローワンス」、ギターひきが
「アコースティック」 というので、わたしの教室でもこう
いう日本語の影響がもろにでます。

こうなると、
会社や工場の机には、「カナ発音表記」 を併用した英和辞典
の方がよいのではないか? などとついつい思ってしまいます。

西村 公正(関西外国語大学短期大学部)



From: (NAKAYAMA Hitoshi)
Subject: [lex] Y2K {04}
Date: Fri, 8 Jan 1999 11:32:19 +0900

中山仁(茨城高専)です

> 村田 年です.
> 中山先生もはっきり言っていただいた方がよかったのではと思いました.
加藤先生、村田先生、須賀先生、鷹家先生、朝尾先生、私の方で言葉が足りず、ご迷
惑をおかけしました。質問の真意を明確にお伝えすべきでした。質問の内容は以下の
ようになります。
 質問の中で問題となる部分は「2000年だから YEAR-TWO-KILO に近い記述な
のかと思うのですが本当のところ何なのか。どう読むのか。」です。したがって、質
問は2つに分けられます。すなわち、第1に「YEAR-TWO-KILO に近い記述なのか」
、第2に「Y2K
はどう読むのか」です(質問の順序を逆にした方がよいかもしれませんが)。
 第1の質問は「Y2K は (the) year two kilo(s)
と読むか」と言い換えてもよいかと思います。ここでは特に、K を kilo(s)
と読み換えてもよいかということが問題になりますが、これについては、そのように
読むことはできないであろうという加藤先生からの御意見を頂きました。
 第2の質問については、須賀先生、鷹家先生、朝尾先生から御意見を頂き、[wai
tu: kei] と読むことが分かりました。
 ありがとうございました。
 ところで、第1の質問に関係しますが、なぜ Y2K の K は kilo
と読まないのでしょう。私の考えうる理由としては、(1) K で終わる(つまり、K
の後に語が続かない)場合は kilo と読まない、なぜなら、(2) kilo
が単独で使われる場合は意味が限定されるから (OALD5 で kilo (kilo- ではなく)
を見ると kilogram、プログレッシブ第3版では 1 =kilogram, 2 =kilometer
とある)、(3) 通例 kilo- は単位を表す語 (gram, meter, byte, etc.)
につく、などがあげられますが、本当の所はよくわかりません。K の文字のもとは
kilo でしょうが、K =
kilo(のように何でもスペルアウトしようとするの)ではなく、K = one thousand
と直接読み換えるべきなのかもしれません。

************************
中山 仁

茨城工業高等専門学校 一般科目



From: SATO Hiroaki <>
Subject: [lex] RE: [lex] ビンディング {01} - {01}{01}余話
Date: Fri, 08 Jan 1999 12:32:46 +0900

専修大学の佐藤です。

NISHIMURA Tadamasa wrote:

> スキー用具のビンディング −発音について
>
> 加藤先生の
> >スキー用具のビンディングですが
> で、英和辞典の発音の表記のことに思いが至りました。
>
> ビンディング は (bind- [b'aind-」)ではなかろうか?と
> 思いつつ、加藤先生の話で、やっと調べてみました。
>
> たとえば技術者が 「アローワンス」、ギターひきが
> 「アコースティック」 というので、わたしの教室でもこう
> いう日本語の影響がもろにでます。

英語の先生も、昔は(?)「チーム・ティーチング」という発音していたような記
憶があります。「チーム・チーチング」の方が規則的ですが、この発音はありま
せん。面白い現象ですね?



From: Minoru Moriguchi <>
Subject: [lex] Corpus & Dictionaries {09}
Date: Fri, 08 Jan 1999 13:31:21 +0900

シャープ・森口です。
東海林先生、リプライありがとうございます。

>> もちろん機械翻訳用の辞書と人間の学習用の辞書では、求めるべきコーパス
>> の方向性が異なるので、実際の作業をどうするかという大問題はあります。
>
>須賀先生のコメントにあったコーパスの「モジュール化」による解決という方法
>が考えられるかもしれません。
>
>それぞれの組織で、ある程度別々に作業を進めるにしても、最初の話し合いによ
>りコーパスの全体構成と共通フォーマットをしっかりと策定しておけば何とかな
>りそうにも思います。

おっしゃる通りだと思います。もし実現することが可能ならば、辞書学者、
ターミノロジスト、英語教育者、翻訳者、機械翻訳研究者などを巻き込んで
突っ込んだ議論が必要かと考えます。

>いずれにせよ、「日本製英語コーパス」が初夢に終わらないことを強く願ってい
>ます。

次回、機械翻訳協会の委員会に出席する際にでも、英語辞書学の分野で、
コーパスについてこういう動きがあるということをそれとなく話してみます。

--
Minoru Moriguchi
Technical Communicator
Personal Computer Division
SHARP Corporation



From: "浅田 幸善" <>
Subject: [lex] predicate offense {02}
Date: Fri, 8 Jan 1999 14:51:36 +0900

加藤先生

Merriam Webster's Dictionary of Law (1996)を見ますと、
predicateには動詞と形容詞としての用法があるようです。

predicate (vt): to set or ground on something: find a basis for--usu. used
with _on_ <if Mary's claim is predicated simply on John's duty of
support--W. M. McGovern, Jr. et al.>

predicate (adj): relating to or being any of a series of criminal acts upon
which prosecution for racketeering may be predicated <a 〜 act> <a 〜 crime>

また、predicate:EVIDENTIARY FACTとあり、
evidentiary fact: a fact that is part of the situation from which a case
arises and that is established by testimony or other evidence--called also
mediate fact
だそうです。

浅田幸善 (ASADA Yukiyoshi)



From: kazuo kato <>
Subject: [lex] predicate offense {03}
Date: Fri, 08 Jan 1999 16:53:49 +0900

浅田先生:

加藤@岩手医大です.ご教示どうもありがとうございました.買わなければな
らない辞書がまた一冊増えたようです.

浅田 幸善 wrote:
>
> 加藤先生
>
> Merriam Webster's Dictionary of Law (1996)を見ますと、
> predicateには動詞と形容詞としての用法があるようです。
>
> predicate (vt): to set or ground on something: find a basis for--usu. used
> with _on_ <if Mary's claim is predicated simply on John's duty of
> support--W. M. McGovern, Jr. et al.>
>
> predicate (adj): relating to or being any of a series of criminal acts upon
> which prosecution for racketeering may be predicated <a 〜 act> <a 〜 crime>
>
> また、predicate:EVIDENTIARY FACTとあり、
> evidentiary fact: a fact that is part of the situation from which a case
> arises and that is established by testimony or other evidence--called also
> mediate fact
> だそうです。
>
> 浅田幸善 (ASADA Yukiyoshi)
>



From: "kawakami yusaku" <>
Subject: [lex] RE: [lex] RE: [lex] ビンディング { {01}01} - {01}{01}余話
Date: Fri, 8 Jan 1999 17:27:00 +0900

-----Original Message-----
From: SATO Hiroaki <>
To: lex List Member <>
Date: Friday, January 08, 1999 12:31 PM
Subject: [lex] RE: [lex] ビンディング {01} - {01}{01}余話

>西宮の川上と申します。大阪の某予備校に勤めています。
> 
>>> たとえば技術者が 「アローワンス」、ギターひきが
>> 「アコースティック」 というので、わたしの教室でもこう
>> いう日本語の影響がもろにでます。
>

「ビンディング」「アローワンス」「アコースティック」の発音は英語教師としては
容認しがたいものですが、ここですでに和製英語になったと考えられます。
 和製英語にはさまざまなタイプがあります。

@ bombers の2番目のbは黙字なのに「ボンバーズ」と発音しています。昔「東京
ボン   バーズ」という楽団がありました。

A かかってきた相手の電話番号が見える電話機を「ナンバーディスプレイ」といっ
ていま すが、テレビ、ラジオを通して聞く「ディスプレー」の発音で「ディ」の部
分にアクセントを置 いているのが気になります。そのほうがかっこよく聞こえるの
でしょうか。英語の dis- に  は第一アクセントは来ないはずですが…。   
  しかし number display そのものがちゃんとした英語なのか、どなたか教えてい
ただけ  ませんか。 



From: kazuo kato <>
Subject: [lex] boxers or briefs? {01}
Date: Fri, 08 Jan 1999 17:36:21 +0900

加藤@岩手医大です.

次期共和党大統領候補に名乗りをあげた John McCain についての新聞記事に
次のようは個所があります:

Oh, Senator, I ask, one final question: Boxers or briefs?
"None of your business," he says. None of your business. It
was music to my ears. (Maureen Dowd)
----International Herald Tribune [New York Times], January 4, 1999,
p. 4

この Boxers は「トランクス」のことだと思いますが,Clinton 大統領が記者
会見で "[Do you wear] boxers or briefs?" という質問に答えたというので
話題になり,今ではお定まりの joke になっているようです.Infoseek で検
索すると700件以上もヒットします.
ところが,"boxer = (in pl.) BOXER SHORTS" という情報を提供しているの
は私が見たところでは The Canadian Oxford Dictionary (1998) だけのようで
す.この辞書については別の話題で昨年12月15日に紹介しました:

> Subject:
> Re: [lex] diary / agenda ?? {01}
> Date:
> Tue, 15 Dec 1998 09:43:14 +0900
> From:
> kazuo kato <>
> To:
>

> 加藤@岩手医大です.
>
> The Canadian Oxford Dictionary (1998)[ISBN 0-19-541120-X] の agenda
> の第4義に "No. Amer. a book containing a calendar and usu.an address
> list etc. used to plan one's activities; an appointment diary" があり
> ます.また,diary の第2義には "a book for this or for noting future
> engagements, usu. printed and with a calendar and other information"
> という語釈があります.(ただ,こちらには "Brit." の表示はありません.)
> しかし,"No. Amer.”といっても,米国でも agenda をこの意味でよく使う
> のかどうかは私にはわかりません.

English Today Vol.14, No.3 [July 1998], pp. 35-39 には "CanOD can do:
an e-mail interview" という題の,この辞書の編者である Katherine Barber
とのインタビューが掲載されています.(別に宣伝を頼まれたわけではありま
せんが,この辞書があまり話題にならないようなので書いてみました.)



From: kazuo kato <>
Subject: [lex] RE: [lex] RE: [lex] ビンディング {01}{ {01}01} - {01}{01}余話
Date: Fri, 08 Jan 1999 18:09:44 +0900

川上先生:

加藤@岩手医大です.

kawakami yusaku wrote:
  
>   しかし number display そのものがちゃんとした英語なのか、どなたか教えてい
> ただけ  ませんか。 

(加藤)
詳しい方が沢山いらっしゃると思いますが,「拙速」情報です.

「ナンバーディスプレイ」にあたる米語の一つは "Caller ID (Service)" かも
しれません."Caller ID" というキーワードで Infoseek で検索すると,この
問題について様々な情報が拾えます.たとえば,California で "Caller ID
(Service)" 禁止条例を作るための住民投票が行われる予定であるとかです.

「ナンバーディスプレイ」を直訳すると phone-number display system などに
なるでしょうか. 



From: "Hideshi TAKAIE" <>
Subject: [lex] {01}
Date: Fri, 8 Jan 1999 18:47:39 +0900

中山先生

> ところで、第1の質問に関係しますが、なぜ Y2K の K は kilo
>と読まないのでしょう。私の考えうる理由としては、(1) K で終わる(つまり、K
>の後に語が続かない)場合は kilo と読まない、なぜなら、(2) kilo
>が単独で使われる場合は意味が限定されるから (OALD5 で kilo (kilo- ではなく)
>を見ると kilogram、プログレッシブ第3版では 1 =kilogram, 2 =kilometer
>とある)、(3) 通例 kilo- は単位を表す語 (gram, meter, byte, etc.)
>につく、などがあげられますが、本当の所はよくわかりません。K の文字のもとは
>kilo でしょうが、K =kilo(のように何でもスペルアウトしようとするの)ではな
く、K = one >thousandと直接読み換えるべきなのかもしれません。

先日、ある病院で「その服いいね?いくらした?」という質問に「50だよ」と言っ
ていました。
50,000円のことです。前回も用例として出した「a salary of $24K」のよう
に、こういう言い方が、市民権を得ているのかも知れませんね。そうなると、Y2K
も、formalに読めば、the year two thousandでもいいのかもしれません。ただ、日
本人には「キロ=1000」は常識ですが、年配の英語人たちはどうでしょうか?
ヤード・ポンド・マイルで生活してきたわけですから、「キロ=1000」の受け取
り方は、案外、日本人より違和感を持っているかもしれませんね。 しかし、「5
0」とは、お医者様の懐具合の暖かいこと!!!
=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
=================================================



From: (畠山 利一)
Subject: [lex] InterLex 13 '99 {01}
Date: Fri, 8 Jan 99 19:01:23 JST

 大阪国際大学の畠山利一 <> です。 
(1)Exeter大学で毎年開かれている国際辞書学コースの1999年の日程が4月19日-2
3日に決まったと下記のemailをもらいましたので、お知らせします。
(2)国際的な辞書学会が毎年あるいは隔年に開かれていたように思うのですが、次
回はいつどこであるかご存知でしたらお知らせ下さい。
************************************************
From: (Reinhard Hartmann)
Subject: InterLex 13 '99

the 13th International Lexicography Course will be held at Exeter from 19th
to 23 April 1999. More information is given in the fourth section of the
D.R.C. Website (see below). The course fee (190) and charges for bed,
breakfast and dinner for residents at the Crossmead Conference Centre
(250) are being held at last year's level.
I should be grateful if you could publicise this information as widely as
possible.

Reinhard Hartmann

Director, Dictionary Research Centre
School of English
University of Exeter EX4 4QH
Tel. 01392 264302
Fax 01392 264361
Email
____________________________________________
Note DRC Website:
http://www.ex.ac.uk/drc/
____________________________________________
***************************************************



From: "kawakami yusaku" <>
Subject: [lex] RE: [lex] RE: [lex] RE: [lex] ビ {01}ンディング {01}{ {01}01} - {01}{01}余話
Date: Fri, 8 Jan 1999 19:35:59 +0900

-----Original Message-----
From: kazuo kato <>
To: lex List Member <>
Date: Friday, January 08, 1999 6:11 PM
Subject: [lex] RE: [lex] RE: [lex] ビンディング {01}{ {01}01} - {01}{01}余話

>西宮の川上です。

加藤先生
 和製英語 number display に相当する英語を教えていただきありがとうございま
す。

 恐縮です。またまた話題が変わります。
 セルバンテスの Don Quixote に出てくる老馬ロシナンテを最近発刊された 
Active Genius p.1264 で Rosinante, Roz- としていますが、 Roz- ではなく Roc-
ではどうでしょうか。

スペイン語 Rocinante
フランス語 Rossinante
ドイツ語  Rosinante

なぜ辞書編集者は別の形を Rozinante にしたかと類推しますと、
@ ドイツ語の si は「ジ」と濁って「ロジナンテ」の音になる。
A イタリア語 「老馬「を表す rozza(ロッツァ)の影響を受けたから。
 と考えられますが、ふつうはスペイン語と同じつづりの Rocinante を使うようで
す。
 なお、小学館の「伊和中辞典」の初版にはこの語は出ていませんが、来月2月の第
2版に期待したいと思います。



From: Asao Kojiro <>
Subject: [lex] RE: [lex] RE: [lex] ビンデ {01}ィング { {01}01} - {01}{01}余話
Date: Fri, 8 Jan 1999 20:34:34 +0900

朝尾@東海大学です。

> 「ビンディング」「アローワンス」「アコースティック」の発音は英語教師としては
> 容認しがたいものですが、ここですでに和製英語になったと考えられます。

もし、誤解していたら申し訳ありません。スキーの止め具で
「ビンディング」と言っているものはドイツ語の Bindung
ではないでしょうか。ゲレンデとかシュプールとか、スキー
関係のことばはドイツ語に由来するものが多いようです。

------------------------------ phone (work): 0463-58-1211 --
朝尾幸次郎 東海大学(文学部)英文学科 内線: 3133
fax (work): 0463-50-2239
-- http://www.lb.u-tokai.ac.jp/~koji/ ----------------------



From: "Hiroshi Suga" <>
Subject: [lex] ロシナンテ {01}
Date: Fri, 8 Jan 1999 22:11:28 +0900

須賀@倉敷天城高校です。

川上先生, HS Quiz 12
http://www.bmcc.org/Qs/public_html/quizzes/relder/hsqz12.htm
lというクイズHPに以下のようなクイズが載っています。

HS Quiz 12
Answer the questions below and then click "submit" to send
your answers.
------------------------------------------------------

Don Quixote, Rozinante, Dulcinea, and Sancho Panza are all
characters in Miguel de Cervantes' masterpeice.

Your answer:
True False

ここでは Rozinante とあります。

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"
倉敷天城高等学校   須 賀  廣
email  : 
Home Page :  http://www1.harenet.ne.jp/~suga

"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"'"



From: "浅田 幸善" <>
Subject: [lex] RE: [lex] RE: [lex] RE: [lex] ビン {01}デ {01}ィング { {01}01} - {01}{01}余話
Date: Sat, 9 Jan 1999 00:17:21 +0900

朝尾先生:
/ai/→/i/というのは音が違いすぎますし、私も、「ビンディング」は英語からきた
のではない、という気がしています。(文字から入ったとすればわかりますが)
語尾の「ディング」というのが気になって、ドイツ語(Bindung)経由であるとは断定
しかねるのですが、 たとえば「小学館 例文で読むカタカナ語の辞典」はやはり、
ドイツ語説をとっています。(その説明は、加藤先生がおっしゃるように小学館の辞
書の例に漏れず「スキー靴にスキーをとりつけるための締め具」となっています。)
英語・ドイツ語の仲間のオランダ語などでも, bindingもしくはski-bindingと言うよ
うです。

>朝尾@東海大学です。
>
>> 「ビンディング」「アローワンス」「アコースティック」の発音は英語教師とし
ては
>> 容認しがたいものですが、ここですでに和製英語になったと考えられます。
>
>もし、誤解していたら申し訳ありません。スキーの止め具で
>「ビンディング」と言っているものはドイツ語の Bindung
>ではないでしょうか。ゲレンデとかシュプールとか、スキー
>関係のことばはドイツ語に由来するものが多いようです。
>

浅田幸善 (ASADA Yukiyoshi)



From: 赤須 薫 <>
Subject: [lex] ビンディング {01}
Date: Sat, 09 Jan 1999 11:12:13 +0900

1/9/98

赤須@東洋大です。

西村先生が以下のように述べておられました。
>加藤先生の
>>スキー用具のビンディングですが
> で、英和辞典の発音の表記のことに思いが至りました。

> ビンディング は (bind- [b'aind-」)ではなかろうか?と
>思いつつ、加藤先生の話で、やっと調べてみました。

もしかすると誤解があるのではないかという気がしましたので、少し書かせて
いただきます。
ビンディングはドイツ語Bindungから入ったことばだと思います。
ですから、バインディングでなくビンディングなのだろうと思います。
元来、スキー関係のことばはドイツ語が主流で、ゲレンデとかシュプールとか
ストックとかいろいろあります。

ではなぜビンドゥングではなくてビンディングなのか。
これはよくは分かりませんが、日本語に入った時に「適当に」訛ったのだろう
と思います。
そう言えば、ストックもドイツ語風に言えばシュトックのはずですが、ストッ
クと言っています。
つづりをそのまま読んだのかもしれませんが、これも同じようなものではない
でしょうか。

以上です。


From: 村田 年 <>
Subject: [lex] ビンディング {01}
Date: Sat, 09 Jan 1999 12:33:27 +0900

INET GATE INP00100 1999/01/09 11:14
題名:[lex] ビンディング{01}

Date: Sat, 09 Jan 1999 11:12:13 +0900
From: 赤須 薫 <>
Reply-To:
To: "lex List Member" <>

1/9/98

赤須@東洋大です。

西村先生が以下のように述べておられました。
>加藤先生の
>>スキー用具のビンディングですが
> で、英和辞典の発音の表記のことに思いが至りました。

> ビンディング は (bind- [b'aind-」)ではなかろうか?と
>思いつつ、加藤先生の話で、やっと調べてみました。

もしかすると誤解があるのではないかという気がしましたので、少し書かせて
いただきます。
ビンディングはドイツ語Bindungから入ったことばだと思います。
ですから、バインディングでなくビンディングなのだろうと思います。
元来、スキー関係のことばはドイツ語が主流で、ゲレンデとかシュプールとか
ストックとかいろいろあります。

ではなぜビンドゥングではなくてビンディングなのか。
これはよくは分かりませんが、日本語に入った時に「適当に」訛ったのだろう
と思います。
そう言えば、ストックもドイツ語風に言えばシュトックのはずですが、ストッ
クと言っています。
つづりをそのまま読んだのかもしれませんが、これも同じようなものではない
でしょうか。

以上です。



From: "Hideshi TAKAIE" <>
Subject: [lex] πの覚え方 {01}
Date: Sat, 9 Jan 1999 19:58:09 +0900

岡山の鷹家秀史です。
先日、英語で「π」の英語版での数値の覚え方を知りました。ポピュラーなものかど
うか知りませんが紹介します。出典は「無限の教室」野矢茂樹、講談社現代新書で
す。
May I tell a story purposing to render clear the ratio circular perimeter
breadth, revealing one of the problems most famous in modern days, and the
greatest man of science anciently known.
この単語の文字数を最初から並べてみると、3.14159....となっているというもので
す。それだけです。
=================================================
      岡山朝日高校 英語科 鷹家 秀史
 e-mail:
Homepage: http://www1.harenet.ne.jp/~takaie
=================================================



From: "Yukihiro Kondoh" <>
Subject: [lex] RE: [lex] πの覚え方 {01} {01}
Date: Sat, 9 Jan 1999 21:47:32 +0900

近藤@四国、です。

鷹家先生 wrote:

>岡山の鷹家秀史です。
>先日、英語で「π」の英語版での数値の覚え方を知りました。ポピュラーな
ものかどうか知りませんが紹介します。出典は「無限の教室」野矢茂樹、講談
社現代新書です。
>May I tell a story purposing to render clear the ratio circular
perimeter
>breadth, revealing one of the problems most famous in modern days,
and the
>greatest man of science anciently known.
>この単語の文字数を最初から並べてみると、3.14159....となっているという
ものです。それだけです。

●もっと簡単で短い例ですが、「カレッジライトハウス英和辞典」に次のよう
な文が載っています。ご存知かもしれませんが・・・。
 
(1)May I have a large [small] container of coffee? <315ページ>
(2)How I wish I could calculate pie! <1310 ページ>

★*☆*★*☆*★*☆*★
Yukihiro Kondoh
    
♪★*☆*★*☆*★*☆*★


→ログメニューへ