マーラ・ヴィステンドール

The Scientist and the Spy』の著者。『WIRED』US版の雑誌2020年5月27日号に「委託殺人ウェブサイト」に関する記事を寄稿。(@marahvistendahl

1937年、作家のジョージ・オーウェルがスペインのファシストと交戦中に首に被弾したのと同じ年、ジュリアン・チェンは上海で生まれた。音楽教師と化学者の両親の下、ミッション系の学校へ進学した彼は、オーウェル同様、言語に魅了されるようになる。自宅では上海語を話しながら、英語、ロシア語、北京語を勉強し、のちにフランス語、ドイツ語、日本語も学んだ。

ところが1949年、毛沢東が政権を握り、オーウェルが『一九八四年』を出版した年、中国で言語を学ぶのは危険な行為となる。1950年代後半の粛清では、知識人は糾弾され、強制労働収容所に送られ、処刑されることもあった。当時、名門北京大学の学生だったチェンは、北京のガラス工場へと追放された。

チェンの仕事は、石炭や灰を積んだ台車を工場の炉まで運んでは戻ることだった。チェンは同僚たちが話しているのに耳を傾けることで、気持ちを保っていた。夜になると、労働者の宿舎で、北京の方言の言語史のようなものを編纂していた。それは1960年ごろに完成したものの、共産党の役人にすぐに没収された。

毛沢東の死後、チェンの運命は好転した。中国経済の発展のためには知識人が必要だと、党の幹部たちが気づいたのだ。チェンは復学し、1979年、42歳のときに試験をクリア、数十年ぶりの海外留学生の一団に選ばれた。チェンは渡米し、コロンビア大学で物理学の博士号を取得した。

当時、米国には中国よりも多くのチャンスがあったため、多くの仲間同様、チェンも学位を取得した後、米国に残り、IBMで物理科学研究に従事した。IBMは世界初の音声認識ソフトウェアを開発し、研究者たちは、たどたどしいながらもキーボードに触れることなく口頭で指示を伝えられるようになる。そして1994年、同社はその北京語ヴァージョンを作成するために人員を募り、チェンは自身の専門分野ではなかったものの、その開発に志願した。

音声認識ソフトが中国語でのコミュニケーションを変える

この音声認識ソフトがオフィスで使用するディクテーション(口述)ツール以外にも大いに役立つと、彼はすぐに気づいた。そして、彼の母語でのコミュニケーションを完全に変えるものになる、と確信した。コンピューター時代における書き言葉として、中国語は長い間、独自の課題を抱えていた。5万字以上の漢字をQWERTY(クワーティ)配列のキーボードに入力する明確な方法がなかったからだ。

最初のパソコンが中国に入ってきた1980年代、プログラマーはいくつかの回避策を考え出していた。もっとも一般的な方法はピンインで、中国人が学校で習う北京語のローマ字表記を使用する方法だ。この方法で「猫」と入力する場合、「m-a-o」と入力し、「貿」や「帽」、または毛沢東の「毛」を含むドロップダウンメニューのなかから「猫」を選択する。北京語には同音異義語が多いため、タイピングだと単語の選択に非常に手間取った。

独自のディクテーションエンジンを開発するため、チェンは北京語を「音素」と呼ばれる最小単位に分解した。そしてニューヨーク在住の中国語話者54名を募り、『人民日報』の記事を読ませて録音した。IBMの北京研究所では、さらに300名のサンプルを追加した。1996年10月、システムのテストが終了するとチェンは中国に飛び、音声テクノロジーの会議の場で「ViaVoice(ヴィアヴォイス)」と名づけたソフトウェアを発表した。

派手な壁紙で飾られた満員の室内で、チェンは『人民日報』を読み上げた。すると少し遅れて、目の前の大きなスクリーンにチェンの言葉が表示された。プレゼンを終えたチェンが室内を見回すと、誰もが呆気にとられたように彼を見つめていた。やがて研究者のひとりが手を挙げ、ぜひ自分もやってみたいと申し出たので、チェンはマイクを手わたした。会場がざわめきに包まれるなか、ViaVoiceは彼女の言葉も理解した。

中国企業の手で自国の誇りを取り戻す

1997年に中国で発売が開始されたViaVoiceの箱に書かれていた謳い文句は、「北京語が理解できるコンピューター! ハンズフリーで、あなたの思考が再現される」。同年、国家主席の江沢民がデモンストレーションに参加すると、ほどなく中国全土のPCメーカー(IBMのライバル社も含む)が、こぞってこのソフトウェアを各自のデヴァイスにプリインストールした。

コンピューターと自由に会話する時代はまだ遠く、ViaVoiceにも限界があったが、中国語をタイプする際の煩わしさを和らげるこのソフトウェアは、中国の知的職業階級の間で普及した。「それが唯一の選択肢でした」とチェンは振り返る。