■聞き手と話し手の「高度な駆け引き」

「発話が終わりそう」というサインを受け取った聞き手は、交替のチャンスを虎視眈々とうかがう。相手の会話の内容を瞬時に理解し、受け答えを高速でまとめ上げたら、相手の発話が終わってから200ミリ秒以内に発話を始めることとなる。まるで格闘技のような高速の駆け引きである。

この時点ですでにだいぶ忙しいのだが、さらにややこしいのが、「聞き手の沈黙時間が長いと、話し手は対処し始めてしまう」ということだ。

例えば、イエス・ノー疑問文に対して、通常の平均応答時間である200ミリ秒内に返答が得られず長い沈黙が生まれると、多くの場合、質問者は聞き方を変える。英語話者の例だが、こんなデータがある。

A「そこの料理はおいしいの？」

（1.7秒沈黙）

A「あんまりおいしくない？」

B「まあね。そうか、そうだね、私が答えないとね」

ここでは、料理がおいしいか聞いたのに、1.7秒間返答がなかったのを受けて、Aが聞き方を変えている。

■会話はシビアな音ゲー

確かに、「はい」か「いいえ」かで答えられる質問に向こうがあまりに長く沈黙すると、何か事情があるのではとか、あるいは聞き方が悪かったのではと思ってしまう。言語学者のゲイル・ジェファーソン（1938〜2008）いわく、基本的には会話の中で沈黙が1秒を超えると話者が違和感を覚え、それを解消しようとするそうだ。雄弁は銀、沈黙は金なのだ。

ここから言えることがある。会話は音ゲーだ。何か質問をされて、たった1秒返答ができなかっただけで、相手からは「不可」が出てしまう。200ミリ秒以内にリアクションを返さないと得点は稼げない。僕たちは友達とカフェでお茶したり、飲み会に出たりするたびに、実はきわめてシビアなゲームに参加している。そこではゲームと同様、ラグは命取りとなる。

■気まずいインタビューで起こった「すれ違い」

僕自身の経験で恐縮だが、雑誌の編集者という仕事柄、インタビューをすることがある。そこで、熟考してから口を開くタイプの人と相まみえたことがあった。

例えば「あなたにとって幸福って何ですか？」と聞いても、黙ったまま3秒以上何も返ってこない。そうすると僕は、「漠然とした聞き方だったので、答えにくいのかもしれない」と気を回す。「では具体的に考えましょう。不快なことが一切起きなかった日と、楽しい出来事が起きたりうれしい知らせが届いた日だったら、どっちが幸福に感じます？」。よかれと思って、二択の質問に変えるわけだ。

しかしそうしても、向こうはじっくりと考え込んでしまう。僕は「なんだか話したくないことを聞いてしまっているのかも」と気まずい思いをしながら、インタビューを終える。

後からインタビュイーに話を聞いたところ、どうやらそれはまったくの杞憂だった。先方は「答えをまとめるのに時間がかかるが、適当な回答をするのは不誠実に感じるから、黙ってじっくり考えたい」と思っていたのだ。しかし、考えをまとめている途中に別の質問をされるので、やりかけの作業を放り出してそっちを考えなければならない。かくしてすれ違っていたようなのだ。

僕がインタビュー下手だというのは認める。ただ、それを差し引いても、人は会話の中で沈黙が続くと、つい何かしら対処をしたくなることの強力な証左ともいえる。

■「はい」より「いいえ」のほうが沈黙が長い

回答までの間に対する深読みは、これだけではない。回答に応じて、その間がそれぞれ異なることもわかっているのだ。その差というのは、僕たちが気づかないほど小さい。

例えば、「沖縄って今雨？」などとイエス・ノー疑問文の質問をしたとする。これに対して、「うん」とか「いや」みたいに答えを出す応答に比べると、「知らない」とか「調べてみるわ」みたいに、質問に答えていない応答などは沈黙時間がやや長い。

前者は平均150ミリ秒だが、後者は650ミリ秒と、500ミリ秒ほどの差があるそうだ。知らないことや答えにくいことを聞かれたら、考えることが増える分応答の遅延も増えるわけで、言われてみればそりゃそうかという話なのだが、ここまではっきりとした差が出るというのは興味深い。

しかし、本当に興味深いのはここからだ。「はい」と答えるか「いいえ」と答えるかで、ラグがわずかに異なると言ったら驚くだろうか。実はそうみたいなのである。肯定的な応答の場合は平均で35ミリ秒のギャップがあるのに対し、否定的な応答だと、その倍近い60ミリ秒を要する。

きわめて短い時間を表す「刹那」という語は、秒に直すと13ミリ秒だという。肯定的な応答と否定的な応答の差は、文字通り刹那ほどの差しかないけれども、無視するには大きすぎる差である。

■沈黙を破る「気まずっ」が持つ意味

最近、若者の間で「気まずっ」ということばがよく使われる。「気まずい」自体は昔から使われていることばだが、近ごろは友人と同じ服を着てきてしまったときや、クラスで先生になぜか褒められたときなど、さまざまな場面で使われるようになった。

「気まずっ」はなぜ連発されるようになったのだろうか？ ある分析によると、その背景にあるのは沈黙の緩和だという。沈黙が流れて気まずいときに自分でツッコむことで、場の空気をリセットしているのだそうだ。これは沈黙が持つ意味を把握した上で、そこに深い意味がないことをメタ的に言明して無効化する、ある種の抵抗なのかもしれない。それほどまでに、僕たちは長い沈黙には耐えられないのだ。

■肯定の間、否定の間

ここまでは「質問」の応答に関する研究を紹介してきたが、「依頼」についても事情は同じだ。

言語学者のコビン・ケンドリックとフランシスコ・トレイラは、依頼や提案、申し出などの実例を電話の会話データから集めた。そして、肯定的な応答と肯定的でない応答（断る以外に、はぐらかしたりやりすごしたりするのも含む）に分け、そのデータを分析した。

まずはやはりというべきか、応答が始まるまでの沈黙時間には差が出る。質問が終わってから700ミリ秒以上経ってから始まる応答は、だいたいが肯定的でない。

それから、肯定的でない応答をする場合は、語り出しの段階で言語ではなく、呼吸音や舌打ちの音が現れたり、「うーん」や「えーと」といったフィラーが挟まることが明らかに多かった。対照的に、肯定的な応答をする場合は、「いいよ」などと最初から言語を発する。

日本でも、困ったり悩ましいことを聞かれた際に、「スゥー」と音を立てて息を吸う人がいる。学生のころ、先生に叱られて「もうお前、帰っていいぞ」と言われた経験のある人はいないだろうか。中学生のころの僕は、ハンドボール部の顧問に何度も言われていた。

難しいのは、「はい、わかりました」と言って帰ったら怒られる一方で、「いやです」と言っても口ごたえとみなされることだ。八方ふさがりである。そして顧問に日々怒られていた僕は、あるとき解決策にたどり着いた。うつむきながら「スゥー」と息を吸うことだと。このテクニックは、今でも職場で上司に叱られたときなどに重宝している。ぜひ皆さんも覚えておいてほしい。

■快諾と乗り気ではないOKの「差」

話を戻す。頼みごとをして、応答が返ってくるまでの時間を話し手は重要な情報だと感じていることは、ほかの研究でも確かめられている。次に紹介するのは、言語学者のフェリシア・ロバーツとアレクサンダー・フランシスが行なった実験である。

彼らはある人が頼みごとをされて承諾する会話を被験者に聞かせて、「応答者は頼みごとを聞き入れる気持ちがどのくらいあると思うか」を判断させた。

ポイントは、「いいですよ」という返答が聞こえるタイミングをいろいろと変えてみたことだ。平均的な間である200ミリ秒前後で返ってきたら、快諾と受け取っていいだろう。でも、2秒後に「いいですよ」と言われたらどうだろう？ 乗り気じゃなさそうだと感じる人が多いのではないか。

■1秒にも満たない時間にも意味がある

では、僕たちは依頼から応答までに何秒経過したら、「この人、気乗りしてないんだろうな」と思うのだろうか？ ロバーツとフランシスはそれも調べている。頼まれてから100ミリ秒から500ミリ秒の間に応答があった場合、被験者は「気乗りしている」と判断する。境目の基準は600ミリ秒だ。ここを少しでも超えると、「本当は聞き入れたくないのだろう」と判断する被験者が急増したという。

質問や依頼への応答にかかる間がわずかに違うだけで、これほどまでに、意味合いが大きく変わってしまうのだ。会話のターンを奪うときだけではなく、頼みごと一つとっても、僕たちは1秒にも満たないわずかな時間に意味を見出しているのである。

こうした研究を知って、僕は正直、恥ずかしくなった。というのも、僕は会話をずいぶんおおざっぱに捉えていたからだ。告白すると、今まで話し相手の身ぶり手ぶりや間にそこまで細かく気を配っていなかった。話している内容ばかりに注意を向けていた。これまでの30年間で会話のきめ細かなテクスチャーを見落とし続け、ずいぶん雑なコミュニケーションをしていた気がして、背筋が凍るような思いだった。

■コロナ禍で普及したオンライン会議

2020年に世界を襲った新型コロナウイルスは、新たな文化をいくつも生んだ。そのひとつが、Zoomを代表とするビデオ通話である。先ほども書いた通り、僕は本業で取材やインタビューを行なうことがあるので、こうしたツールには大変お世話になっている。

これまでは東京に住んでいない人に取材をするときは、出張できなければ電話するしかなかった。ボイスレコーダーをつないだマイクを耳に挿して、電話をかける緊張感といったらなかった。口元も表情も見えないので、相手がどんな様子で話しているのかわからないのである。

それがビデオ取材になり、ずいぶん楽になった。相手の顔が見えるだけでこんなに違うのかと感動し、今では仕事に欠かせないものとなっている。

■なぜ「リモート飲み会」は廃れたのか

その一方で、コロナ禍で一世を風靡したのに、今ではさっぱり見なくなった文化もある。

代表例が「リモート飲み会」だ。

Zoomをつないで友人や職場の人が一堂に会し、PC画面の前で飲み会をする。不要不急の外出が禁じられた緊急事態宣言下には、僕もいろいろな友達とリモート飲み会をした。しかし今や、この文化は絶滅危惧種と言っていい。

もちろん、今は対面で会えばいいというのもある。ただ、例えば海外赴任をしている友人や、地元の家族とこれをやりたいかと言われれば、全然気乗りしない。その理由を考えると、先ほどの「沈黙の意味」も実は大きいのではないか。

コミュニケーションは本来、たった0.1秒の差で大きな違いを生むのである。取材のように目的のはっきりしている会話ならまだしも、複数人の友達とお酒を飲みながら歓談する際に、通信のラグがあるビデオ通話は不向きだ。

水野太貴『会話の0.2秒を言語学する』（新潮社）

実際、ターンテイキングにかかる時間も延びてしまう。ある研究によると、ふたりの人がリモートで対話すると、ターンテイキングには平均487ミリ秒を要した。

Zoomの音声送信にかかるラグは約30〜70ミリ秒なので、それを加味しても明らかに手間取っている。対面の会話では視線やジェスチャーといったヒントを受けながらターンを取ることを先にも見たが、これがビデオ通話ではほとんど打ち消されてしまうからだろう。

また、多数の人間が出席するビデオ通話では、複数人が同時に会話のターンを取ってしまう事故も頻発する。これもおそらく、僕たちが普段の会話で使っているヒントを駆使できないからだと考えられる。

ちなみに僕は、Zoomで発話が重なるとたいてい先方が折れてくれるので、かまわず話し続けることにしている。昔、「ゆる言語学ラジオ」相方の堀元さんとZoomで打ち合わせをしたら、珍しく向こうも同じ戦略を採用していたらしく、ふたりが数秒間同時に話し続けるという珍妙な時間が発生した。あれは恥ずかしかった。

