世界の言語はコンピュータが救う

少し前に、日本で大ヒットした映画「アナと雪の女王」を観に行きました。
そのきっかけだったのが、主人公のひとり、エルサが歌う「Let it go」の25か国語バージョンの動画です。
25か国語で感情豊かに歌うエルサ、素敵です。

この動画をみて、小学校の文集に書いた「世界中の人と話せるようになりたい」という希望を思い出しました。
外国語学習に意欲的な小学生だったのかな、と思いましたが、よくよく思い出してみると、実は「もしも一つだけ願いが叶うなら」という、自分で努力しなくても実現したらいいと思うことを問う質問に対する答えでした……

そりゃあ、十数年(まだかろうじて)経っても英語ひとつ操れるようになっていないわけです。
知り合いには「言語を扱う会社に勤めているのになんで?(笑)」みたいなことを言われますが、そもそも言語学と語学は同じではない、というより全然似てません。
語学は、外国語学習と置き換えることができ、わかりやすい。
言語学は、うーん。ことばの仕組みを考察する科学、でしょうか。
話がそれました。
「なぜ今、世界中の人と話せていないのか」
理由は何か考えてみました。
「世界の(言語or文字or音or文法)は多すぎる」
あたりまえですね。人間には語学以外にもやりたいことややらねばならないことがあり、例えば100の言語を操るために、寝る間を惜しんで50年かけたとして、それだけで偉業だとは思いますが、世界の言語というと軽く数千は超えるそうです。かなり長生きしても難しいですね。
人間には時間がかかりすぎるからできない、けれど、コンピュータの力を借りたらどうでしょうか。
どんなに異なる言語を使う人たちでも、コンピュータの力を借りて、スムーズにコミュニケーションできたらいいと思いませんか?
コンピュータに世界中の言語を理解させるためには、たくさんのデータが必要です。
言語や方言は話している人の音声データ、動画データとして収集することができます。
また、形態素区切り、品詞情報付き、辞書、文節区切り、係り受け情報、対訳データ、などのさまざまな形のテキストで収集することができます。
データさえあれば、コンピュータの力を借りることで、他の地域の言語や100年先の言語と比較・翻訳することもより容易になります。
また、今なくなろうとしている言語をコンピュータが救うことができるかもしれません。
「危機言語」という言葉があります。絶滅危惧動物の言語版です。
日本語はどうでしょうか。2014年5月ごろに発表された「消滅可能性自治体」を考えると、多くの方言が消滅しそうだ、現に、方言はあまり話されなくなってきている、と思われる方も多いのではないでしょうか。
文化庁のページで日本国内の危機言語とその取り組みが公開されています。
http://www.bunka.go.jp/kokugo_nihongo/kokugo_sisaku/kikigengo/

危機言語はあっという間に消えてしまうかもしれない。残そうと思っても時間は止まってくれません。
今の言語をテキストや音声や動画などのデータとして記録させておくことで、分析にかける時間を将来に回せます。

危機言語ひとつひとつに文法書を書いていくことは時間もコストもかかり、非常に困難なことですが、ある言語が消滅してしまう前にそのデータを集めることは、現在から未来への贈り物となるかもしれません。

S.F