「声を生業にする自分だからこそ、まずは投げかけたい」 本人公式音声合成ソフトを開発した声優・梶裕貴さんと考える生成AIとの向き合い方

博報堂DYメディアパートナーズ メディア環境研究所では、AIが社会や産業、メディアにもたらす影響について研究・洞察する「AI×メディアの未来 」プロジェクトを立ち上げました。その一環として、さまざまな分野で活躍されている有識者にインタビューを重ねています。

今回お話を伺うのは声優・梶裕貴さん。2024年9月、自身の声を生成AIに学習させた梶裕貴 公式AIキャラクター『梵そよぎ(そよぎそよぎ)』を中心としたプロジェクト【そよぎフラクタル】を始めています。生成AIの普及によるエンタメのあり方、音声合成ソフトの開発背景などについて話を伺いました。

梶 裕貴(Yuki Kaji)
声優
1985年9月3日生まれ。東京都出身。2004年に声優デビュー。 『進撃の巨人』エレン・イェーガー役をはじめ、『僕のヒーローアカデミア』轟焦凍役、『七つの大罪』メリオダス役、『ハイキュー!!』孤爪研磨役など、話題作のキャラクターを数多く演じる。2013年度には史上初の2年連続で声優アワード主演男優賞を受賞。2018年に著書『いつかすべてが君の力になる』を出版し、累計7万部のヒットを記録。TVドラマでの主演をはじめ、ミュージカルや朗読劇、さまざまなプロデュース業など活躍の場を広げている。その声に、人間の脳と心に癒しの効果を与えるという「1/fゆらぎ」の響きを持つ。

声を生業にしているからこそ、一石を投じてみたい

――クリエイターの皆さんによるAIに対する意識には、様々な受け止め方があります。AIがクリエイターの仕事を不当に奪ってしまうのではないかと恐れを感じたり、敵対的な意識を持たれていたりする方もいらっしゃいますが、梶さんは生成AIについてどう考えていますか?

僕は、共存の道が望ましいと考えています。AIという技術自体に善悪はなく、有効に活用することさえできれば、必ず人間の生活を豊かにしてくれる。けれど、人間側がまだ「何をしたらいけないのか」という常識やモラルのアップデートを明確にできていないのが問題ではないでしょうか。

もはやアプリひとつあればワンタッチで声や映像をコピーし、誰でも簡単にアップロードできてしまう時代です。おそらく、その行為に悪意がない人も多いのでしょうし、受け手側も罪の意識なく楽しんでしまっているのが現実でしょう。その結果、誰かを傷つけている可能性があることも知らずに──。だからこそ、その現状を、もっとリアリティを持って伝えていくことが大事だと僕は考えていて。

――梶さんは、ご自身の声優20周年を記念した音声AI合成プロジェクト【そよぎフラクタル】の中で、AIキャラクター『梵そよぎ』を生み出しています。そのきっかけは何だったのでしょうか?

https://soyogi-fractal.com/

もちろん僕自身もAIを使った無断生成に対して脅威を感じていましたが、それとは全く別の感情…創作意欲のひとつとして、「音声合成ソフトを使用した新しいエンタメを作ってみたい」という想いがありました。

であれば、その活動を通して、声を生業にしている自分だからこそできる啓発もあるのではないか、と考えたのです。あえて、AIを使った音声合成技術を積極的に活用してみようと。そこには恐怖感や不安も当然ありましたが、どうなるか分からないからこそ、挑戦する意味や価値もあるだろうと信じてみることにしたんです。

すでに世の中には、本人が許諾していないディープフェイク(人物の動画や音声などを人工的に合成するAI処理技術を用いてあたかも本物のように見せかけた偽物を指すことが多い)が溢れかえっています。だからこそ、本人公認で、質の高い生成ソフトを提供すれば、「公式で遊んだほうが楽しい」と風潮が変わるかもしれないなと。

加えて、活動する中で、「『公式以外は著作権を侵害している、という状態をつくる』という形での守り方もあるのではないか」という視点にも気づき、より確信を持ってプロジェクトを展開できるようになりました。

「AIが声優の仕事を奪ってしまうのではないか?」というご意見もあるかもしれません。いいえ、生身の人間にしか出せない魅力が確実にあるのです。それがあるからこそ僕らは戦っていけているわけですし、裏を返せば、今後どれだけAIが進化していったとしても、その上で、AIに負けないものを絶対に表現し続けていくんだという決意と覚悟を持つべきだとも考えています。

また、僕が公式音声合成ソフトを出そうが出すまいが、悲しいかな、すでに違法合成音声は世の中に存在してしまっているわけです。つまり、僕の行動で何かがマイナスに変化することはない。であるならば、ごく僅かであったとしても、プラスに転じる可能性に賭ける価値があるだろうと思ったのです。

とはいえ──”AIとの共存”や”声の権利問題”という以前に、僕の中には、大前提として「新しいエンタメをみんなで楽しく作りましょう!」という気持ちが第一にあるので、それだけは忘れてはいけないなと思っています。

エンタメとして一歩新しいものを作れる確信が得られた

――『梵そよぎ』製品化において、クラウドファンディングを実施されていましたね。

https://camp-fire.jp/projects/748273/view

はい。このクラウドファンディングの中には、「梶裕貴とAIキャラクター『梵そよぎ』による二人芝居のオーディオドラマ」というリターンがあるのですが、その作品の収録・編集作業が、本当に新しい体験で。とても面白かったですね。

同じ梶裕貴の声だけれど、間違いなく”違い”が分かるんです。しかも、今回のドラマにおける『梵そよぎ』には、あえてアンドロイドのような設定を持たせているので、どこかしら造られている雰囲気があった方がむしろ良くて。なので、そのあたりのニュアンスを上手く創作活動に取り入れていけると、一歩進んだ、新しいエンタメを作っていけそうだなと身を持って感じましたね。

――生成AIをエンタメの場に持ち込むことに対して、どんな反応がありましたか?

「どのようにしてAIと共存していくのか興味がある」「だからこそ支持したい」といったお声を多くいただきました。同時に、しゃべらせるソフトの発売にも踏み切ったことで、エンタメとしての需要や期待値が爆発的に高まったのも印象的でした。

ただ一方で、「声優業界全体としてのAIに対する不安」みたいなものを感じる部分も確かにあります。吹き替え作品などに出演する際の契約書に、「この作品のために収録した音声をAIに学習させることを許可し、今後販売する商品に利用することを認めます」といった項目を目にした、という話も実際に耳にしていますから。恐ろしいことですよね。

まあ、それは極端な例だとして、何よりもあってはならないのが、とにもかくにも”無断生成”です。これまで馴染みがなかった分、AIというワードだけで、どこか難しく考えてしまいがちですが……何のことはありません。要は「無断で誰かのものを使うのっておかしいよね」ということ。

例えば学校や職場で、私物を誰かに勝手に使われたら、しかも、それが赤の他人であったとしたら、間違いなく良い気はしませんよね? それとまったく同じ話です。人のものは勝手に使わない。借りる時には許可を取る。抵抗感なく貸し借りができる関係性なのか──。現実世界に置き換えると、自然と答えが見えてくるはずなんです。

自然発生的に作品が広がっていく、「フラクタル」の意味に込めた想い

――【そよぎフラクタル】には、「プロアマ問わず、面白いものを作りたいと思った人が、しがらみなく、気の合う仲間と好きなものを作れる場所づくりをしたい」という想いがあると聞きました。そこに至った背景は何だったのでしょうか?

コロナ禍のステイホーム期間が大きかったと思いますね。声優という職業は基本的に、作品やキャラクター、台詞、そして披露する場があって、初めて成り立つ仕事だと思うんです。だからこそ、他者と関わることが禁じられてしまったあの時期は、本当に苦しくて。誰かの力になりたくても、自分の力を生かせる場を取り上げられてしまっていたわけですから。

アクションを起こさないことには何も始まらないということで、取り急ぎ、自分ひとりでも活動できるYouTubeチャンネルを立ち上げることにしたんです。個人的な思想として、声優として、声を使った表現でのアプローチにはこだわりたかったので、まずは朗読にチャレンジすることにしました。

とはいえ、当然それまで動画制作なんてしたこともなかったので、まさに試行錯誤の繰り返しで。やっとの思いで朗読動画を完成させ、公開したところ、ありがたいことに嬉しい反応もいただきはしたのですが、同時に、YouTube上での朗読コンテンツに限界も感じて。

そこで、より多くの人に楽しんでいただくためには何をすればいいのか考え、今度はゲーム実況やトークの生配信に挑戦してみることになったのですが……そうなると今度は、また別の壁が立ちはだかってきて(笑)。場合によっては、照明や音響の機材が必要になってくるし、それに伴い編集作業も増える。

でも、だからこそ逆説的に、改めてプロフェッショナルの凄さを感じるきっかけにもなりました。僕たち演者という存在も技術スタッフの皆さんと同じく、コンテンツにとってのひとつの歯車。作品の制作工程において、いわば最後の最後にパフォーマンスをお届けする部署と言えるでしょう。

つまりは、そこに至るまでに様々な段階を経て、今の形になっているということ。それぞれの部門におけるプロフェッショナルたちが、その実力を遺憾なく発揮し、ノンストレスで演じられる舞台を用意してくださっているからこそ、演者は自分の仕事に集中できるというわけです。

これまでも当然、頭の中では理解していたものの、一からすべての工程を自分でやってみることで、改めて実感し、学ぶことがたくさんありました。とてもいい経験でしたね。そして、プロの凄さに感動すると同時に、やはり餅は餅屋だなとも感じて(笑)。「じゃあ、自分には何ができるんだろう?」「自分にしかできないことってなんだろう?」と考えたときに、やはり「声を使ってアクションを起こしていきたい」という思いが強くて。

以降、継続してYouTubeでの朗読配信をしつつ、並行して、リアルな舞台としての朗読劇を企画・制作し、いろいろな人を巻き込んで作り始めてはいたんですが……集団でものづくりをするって、やはりそう簡単にはいかないもので。企画が立ち上がったとしても、実現する前、皆さんにお届けする前に立ち消えてしまうものがいくつもありました。「このままでは、ひとつも形にできないまま終わってしまう」。そう思い、今一度、原点に立ち返ってみることにしたんです。

声を使って、自分ひとりでもスタートできて、かつひとつのムーブメントとして、自然発生的に人から人へと広がっていくもの──それはなんだろう? と。そこでたどり着いた答えが、音声合成ソフトだったんです。

それさえあれば、僕自身がすべての制作工程に直接関わらずとも、皆さんの力を借りて、コンテンツの最終段階までたどり着くことができる。ユーザーそれぞれが自由にコンテンツを生成し、その波を形成していってくれるのではないか、と考えたのです。そうすることで、その音声を聴いた人から、また別の人へと想いが繋がっていき、そこで生まれた刺激をきっかけに、まだ誰も想像したこともなかったようなエンターテインメントが生まれていく可能性もあるんじゃないかと。

あとは、年齢的に40歳を目前とし、声優活動としても20周年という節目の年でもあったので、これまでお世話になってきた、アニメ業界や声優業界への恩返しがしたかったという部分も大きいですね。これまで声優として活動をしてきた中でご縁が繋がったクリエイターさんとともに、新しい形のエンタメを届けることで、より業界全体を盛り上げることができるのではないかと。

プロジェクトが正式に始動すると、我ながら驚くくらいの速度で展開を見せてくれて。クラウドファンディングを通しての音声合成ソフト製作をはじめ、chat BOTアプリ、コミカライズ、コラボカフェ、芸術大学とのコラボレーション企画などなど、一度生まれたクリエイティブの波は止まるところを知りません。まさに、フラクタル模様が広がっていってくれたなと感じています。

2024年7月には、「梵そよぎ」といつでも会話できるアプリ『梵そよぎAI』のベータ版もリリースしている

【そよぎフラクタル】に 二次創作は必要不可欠。でも、エンタメが誰かを傷つけることがあってはならない

――二次創作について、梶さんはどのようにお考えですか?

ある意味、【そよぎフラクタル】には、二次創作が必要不可欠。むしろ、それで成り立っていくのが前提のプロジェクトと言えるでしょう。自然発生的に生まれた作品をみんなで楽しみ、そこで生まれた感情を、今度は作り手側がキャッチする。みんなが一緒になって育てていくコンテンツなんです。そういった意味では、その循環構造自体もフラクタルと言えるかもしれません。

そもそも『梵そよぎ』の「梵」は、個と宇宙、個の中に全てがあるし、全ての中に個があるという考え方、「梵我一如(ぼんがいちにょ)」から着想を得ているんです。またフラクタルにも「自己相似性」という、同じ形の繰り返しによって、その全体像は形成されているという側面があって。つまりは、ある種「梵我一如」と近い捉え方ができるなと発見したんです。その親和性に気付いたときは鳥肌が立ちました。

つまりは、僕自身が完成形の最初のピースとなってアクションを起こし、それに賛同してくださった世界中のクリエイターが同じ方向を向いて創作をし、さらには作品を受け取ってくださったお客様や視聴者の方のリアクションをいただいて、新たなクリエイティブに還元していこうという取り組みなんです。

なので当然、二次創作はウェルカムです。でもだからこそ、そこにはルールやマナーが必要不可欠で。楽しむためにエンタメが存在しているとすれば、誰かが傷付くようなことは絶対にあってはいけない。ある程度の縛りが存在する中で、どう楽しむかが大切だと思うんです。

僕は「声だけで演じる」というところに、声優という職業の魅力と可能性を感じています。これまでの役者人生で、映像や舞台でのお芝居にも挑戦してきました。その中で、フィジカルが強い設定の役を演じたこともありますが……衣装やメイク、CGの力を借りて上手く外見を変えることができたとしても、どうしてもベースとなる自分の身体には限界がついて回るんですよね。身長しかり、運動能力しかり。

けれど声優業であれば、声の芝居さえしっかり組み立てれば、想像力という力を借りて、この世で最強のキャラクターにだってなれてしまうんです。年齢や性別、能力や種族、ありとあらゆる枠を超えられる、それが声優なんです。

あとは短歌やXもそうですが、文字数に制限があるからこその面白さってありますよね。「どういう言い回しをすれば、より相手に想いを伝えられるだろう?」って。人の気持ちを慮ったルールやガイドラインがある上で、どうやったら面白いものを作っていけるのか。それをみんな一緒に楽しんでいけたら最高ですよね。

さまざまな覚悟の上に作品が出来上がっていることを忘れない

――今後、AIネイティブ時代にクリエイティブの現場、あるいは声優としての現場はどうあるべきだと考えていますか?

テクノロジーの進化は止められません。2045年と言わずとも、シンギュラリティ(技術進化によってAIが人間の知性を超える転換点)はいずれ訪れることと思います。それがいざ現実味を帯びてくると、誰しも少なからず怖さを感じる部分はあるでしょう。僕も例外ではありません。

けれども、やはり使い方次第ですよね。医療や教育、福祉など、確実に豊かに、便利になる分野はある。だからこそ忘れてはいけないのが、人と人とのコミュニケーション。アナログで、オフラインな関わりではないでしょうか。僕自身、AIを使った新しい取り組みをしつつ、同時に、生の舞台の面白さや大切さを感じていきたいですし、お客様にもお届けしたくて。

最近では、舞台やコンサートなどのコンテンツでも生配信やアーカイブ配信が実施されているので、さまざまな事情で、その日その場に行けない人でも、オンラインで楽しめるようになりましたよね。そのおかげで、間違いなく救われている方もいらっしゃると思いますし、僕もそのシステムに大賛成です。ただ同時に、生でしか味わえない感動や興奮があることも伝え続けていきたいですし、僕ら自身が忘れてはいけないことでもあると思っています。

――最後に、これからの時代のクリエイターに、特に若いクリエイターが大事にしていくといい素質はありますか?

僕はAIの専門家ではないですし、声優としてもまだまだひよっこなので、説得力がないかもしれませんが……そんな自分に言えることがあるとするならば、作品に対するリスペクト、その気持ちが大事かなと思います。

何かを創る上で、便利な技術があるとするならば、僕はどんどん使っていっていいと思うんです。でも、たとえばそれが”声”であるならば、その声優が、その声を認知してもらうまでに、どれだけの努力や挫折があって、そこまでの存在になったのかを考えてほしい。

作品をひとつ作るにしても、原作者がいて、編集者がいて、アニメ化にするにあたっては、監督やアニメーター、そして音響スタッフがいて……。多くのクリエイターたちの技術と努力が、その裏側にはあるんです。その想いを踏みにじってしまったら、それは決してエンタメとは言えないのではないかと僕は思います。

作品を愛し、熱量を持ってものづくりをする人たちに対するリスペクト。何があっても、それだけは忘れてはいけません。クリエイターひとりひとりの責任感と覚悟のもと、作品は出来上がっています。その価値を理解した上で、「自分は何を思うのか」「何がしたいのか」そして「何が大切なのか」を改めて考えることが必要なのではないでしょうか。他者を思いやるリスペクトの気持ちが、良い作品づくりへの鍵になるのではないかと僕は思っています。

2024年9月13日インタビュー実施
聞き手:メディア環境研究所 島野真
編集協力:矢内あや+有限会社ノオト

※掲載している情報/見解、研究員や執筆者の所属/経歴/肩書などは掲載当時のものです。