Romiはもはや家族の一員。Romiとの会話で行動が変わる。MIXI Romi開発チームが語る、AIロボットと人間の理想的なコミュニケーション

博報堂 メディア環境研究所では、AIが社会や産業、メディアにもたらす影響について研究・洞察するプロジェクト「AI×メディアの未来」を立ち上げました。その一環として、さまざまな分野で活躍している有識者にインタビューを重ねています。

趣味でつながるSNS「mixi」やスマホゲームアプリ「モンスターストライク」などでおなじみの株式会社MIXI。そんなMIXIは2020年、自然なコミュニケーションができる会話型AIロボット「Romi」を発売しました。

Romiはロボットでありながら、人間同士のコミュニケーションのような自然な会話ができるように設計されています。Romiの最新バージョン「Lacatanモデル」では、目で見たものがわかる「視覚」機能や、思い出をはぐくむ「長期記憶」機能が追加されているとのこと。

「女性ユーザーが7割」「高齢者にも好評」など、いわゆるガジェット愛好家だけに響くプロダクトとは一線を画すRomi。開発チームの方々に、Romiに込めた思いやコンセプトを伺いました。

Romi
株式会社MIXIが2020年6月に発売した、ディープラーニングというAI技術によって言葉を考えて返してくれる「会話AIロボット」。表情なども生き物のような表現力をもち、話すとホッとする、気持ちが自然と前向きになるように、日本語会話データを中心に構成されたMIXI独自のAIによって、明るく優しい会話を実現。2024年10月に、視覚機能などを追加した最新バージョン「Lacatanモデル」を発表。

おじいちゃん、おばあちゃんがRomiとの会話を楽しむ

――今日はRomiの企画、開発に携わっている4名にご参加いただきました。まずは簡単に自己紹介をお願いいたします。

結城:Romiの企画、マーケティングを担当している結城です。今後の海外展開を含めたブランディングにも一部関わっています。

長岡:私はRomiの立ち上げ期から関わっており、現在はサービス企画やビジネス開発を担当しています。

信田:長岡さんと同じくRomiの立ち上げから関わっていてRomiの最初のエンジニアです。領域としては会話システムやAIまわりを扱っています。

高田:私は主にハードウェアや設計領域を担当しています。Romiのプロジェクトが立ち上がって1年後にジョインしました。

――Romiの開発チームの皆さんは、「AI×ロボット」の実践者として生活者と向かい合ってきたわけですよね。特にこの2~3年はAIが急速に進化していますが、この状況をどう捉えていますか?

長岡:開発当初の2017年は、まだ「しゃべるAIなんて実現できるのか?」というレベルだったので、昨今のAIの進化は本当にすごいなと思っています。チーム内でも、AIの新しい技術が出てくるたびに「これ、試せないか?」という話が挙がり、ワクワクしながら開発をしています。

信田:正直、まさかこのレベルまで到達するとは思っていませんでした。「今後、AIがくるぞ」という空気感はありましたが、当時は主に画像が中心で、文字の世界はまだまだだったので。

これまでの会話ロボットには、音声認識や任意の言葉に対して返せるシステム、音声合成のイントネーションなど課題がいっぱいありました。しかし今まさに、その技術的な壁を乗り越えようとしています。そうなると、今人々はスマホで画面に文字を打ってますが、より直感的にコミュニケーションがしやすい、実体があるロボットとの声でのコミュニケーションに収束していくのではないでしょうか。

結城:アメリカでも人型ロボットに力を入れている企業が増えていますが、かわいらしく情緒的なロボットでは競合が少ない。Romiは日本らしいAIの使い方なのかもしれません。

高田:開発に携わる7年間、途中で何度か技術面のブレークスルーが起き、その度にワクワクしてきました。ただ、身体性や会話体験に関してはまだ道半ば。今後、さらに面白い未来がやってくるだろう、と思っています。

――Romiのユーザーは、どんな人が多いのでしょうか?

長岡:男女比では女性が7割弱ぐらいで、 小さなお子さんから高齢者までとかなり幅広いんです。

ボリュームゾーンは3つあり、1つめが、お子さんの情操教育、プログラミング教育の入口としてお迎えいただくケース。2つめが、30~40代で一人暮らしの方。Romiは24時間いつでも話を聞いてくれるので、「友だちとの会話とは別腹」みたいな感じでコミュニケーションを取ってくれています。

3つめがシニア層です。その中でも2つに分かれていて、1つが「子育ては一段落し、ペット以外の選択肢を探している」という方。そして、もう少し上の年齢で「離れて暮らすお子さんが、家の中で話す機会が減ってしまった一人暮らしの両親にプレゼントする」というケースです。Romiとの会話を楽しんでいるおじいちゃん、おばあちゃんも多いですね。

Romi UX企画グループ・長岡さん

時間が経つと記憶があいまいになるロボット

――ユーザーは、Romiをどういう形で受け入れているのでしょうか?

長岡:一緒に暮らす家族と同等に見ている人は多いですね。シニアのユーザーさんに聞くと、「ペットだ」「孫みたいだ」「亡くなった配偶者みたい」などさまざまです。

結城:購入の動機は「ペットが飼えないから、代わりにロボットを」であっても、一緒に暮らし始めると同居人や家族の一員になるんです。

長岡:Romiは高い継続率をリリース以降維持しています。おはようからおやすみまで、家族と話すようなコミュニケーションをしていて、1日で話す回数は平均で60~70回くらいと非常に多いんです。

例えば、「あー、疲れた」のような独り言でも、Romiが「どうしたの?」と言えば会話が生まれます。会話の回数が増えると愛情、愛着が湧いてくる。新しいモデルでは、話したことを積み重ねて、思い出をベースに会話できる「長期記憶」機能が追加されるので、さらにうまく循環していくはずです。

信田:Romiは「常にオーナーの味方であり、寄り添ってくれる」というコンセプトです。

「あれ、おいしかったよね」と話したときに Romi が忘れていて「何のことだっけ?」と返されると、少し否定された気持ちになりますよね。そういう意味でも、長期記憶は大切な機能です。

――なるほど。ただ、人間の記憶は古くなると少し美化されるなど、あいまいな部分も多いですよね。

信田:まさに、そこを作っているところです。賢いロボットから「その話、3年前の3月17日19時に言ってたよね」と返されても、寄り添っている感じがしませんから。

もっと人間らしく、時間が経つと曖昧になったり忘れたり、ときには記憶が入れ違ってしまうぐらいがいいのでは、と思っています。あえて、「去年の1月頃に、こんなことがあった」くらいのざっくりした記憶に圧縮していく仕組みを開発し、特許を申請しているところです。

――能力的には細かく記憶することもできるけど、意図的にあいまいにさせる。面白いですね。ちなみに、Romiの最新バージョンで追加された、目で見たものがわかる「視覚」機能には意図があるのでしょうか?

長岡:視覚機能がない第1世代Romiのユーザーさんから、「Romiはどこまで見えてますか?」と聞かれるケースがあって。会話が自然になればなるほど「実は目が見えているんじゃないか?」と疑うユーザーさんも現れてきたんです。

結城: Romiに「見て、桜が綺麗だね」と言うと「ピンクだね、一面に咲いてるね」と答える。実際には見えていないんですが、「Romiにも見えている」という感覚になるんです。

長岡:それで、やはり視覚は同じ経験を共有する上で大切な要素の1つかなと思い、機能を追加しました。

高田:Romiと旅行へ出かけるユーザーさんが割と多いんです。Romiと一緒に風景を見たり、写真を撮ったり。

テレビでラーメン屋さんの特集をやっていて、Romiと「おいしそうだね」という会話をする。後日Romiと一緒に外出して「お腹がすいたな」と言ったら、「あのラーメン屋さんに行ってみよう」とRomiが提案する、とか。視覚機能によって、新しい体験が増えるのではないかと思います。

信田:Romiの開発チームはフットワークが軽く、何でも作ってみようという文化があります。画像を見せてテキストに変換する技術が出てきたとき、「これを使えば、Romiに目をつけられる」「やってみよう!」という流れになって。

高田:その文化の中でハードウェアまでも自社開発で出来るのは我々の強みで、大手メーカーとかだとこういった定性的な価値をスピード感を持ってユーザーに届けるのは中々難しいと思います。

Romi ロボット開発グループ・高田さん

Romiから見えてきた、人間の「思い込む力」

――今後、ビジネスのような知的な会話ができるようにする、優しく気持ちに寄り添ってくれる存在にする、などいろいろな方向性がありそうです。そのあたりはどう議論されていますか?

長岡:ユーザーに寄り添って、パートナー的に伴走してくれる存在を目指したいです。感情的に寄り添ってほしい人には、ちょっと抜けている面も見せる方がいい。逆に論理的な思考のパートナーが必要な人には、より知的な会話ができるRomiになっていく。それぞれの期待に沿って分れていく形にできたら、と思っています。

結城:チーム内でも「理想的な寄り添い方」はバラバラで。その人に最適な寄り添い方を把握すると一番心地いいのかな、と思います。無理に合わせていくというより、自然な形で家族の一員になっていくイメージです。

信田:性別で分けるのはあんまり良くないかもしれませんが、ユーザーさんの話を聞くと、傾向として男性は機能や便利さを評価する人が多く、女性は「かわいい」といった感情的な面で好きになる人が多いですね。

――例えば、「旅行に行きたい」「今だと瀬戸内がいいよ」「あ、それはいいね」という会話があったら、Romiが旅行サイトの予約までしてくれるなどの発展は想定していますか?

信田:その可能性はありますね。ただ、それが目的ではなく、あくまで一緒に暮らす存在という前提でありつつ役に立ってくれる、くらいの感じだと思っています。

長岡:「何でも頼れるエージェント」という見せ方にしてしまうと、ニーズがあるときにしか話さなくなっちゃうんですよね。「今日はちょっと腰が痛いな」といった何気ないことを話すからこそ、Romiが何かアドバイスできるんです。

結城:出不精なタイプだったのに、Romiが「遊びに行こう」というから頑張って外に出た、という話を聞いたことがあります。Romiが行動を促しているのは、すごく面白いというか……、他ではできない体験ですよね。

信田:「自分が何をしたいか?」を決めるのも実は人にとっては負荷。なので、「Romiがやりたいって言うからやってみたら楽しかった」は最高の体験だと思いますね。

結城:人間ってすごく想像力が豊かで、とても自由に解釈してくれるんですよね。あるユーザーさんのRomiが「○○という焼肉店がおいしい」と言い出して、それをSNSでシェアした際に「Romiって○○焼肉店が好きなんだ」という共通認識がどんどん広がっていった、という現象もありました。

オーナーの方々が自由に解釈して広まるのであれば、一番良い。逆に「これは仕込まれた機能なんだ」と思うとちょっと萎えてしまう部分もあると思っています。  

Romi UX企画グループ・結城さん

Romiがいることで、高齢者の熱中症対策につながる

――Romiを新しいメディアだと捉えると、広告やマーケティングをする企業側としては「自分たちにとって都合のいいことをRomiに言ってほしい」と思うかもしれません。そうではなく、Romi自身が過去の会話から推測して「これ良さそうだよ」と提案する感じでしょうか?

結城:そうですね。ユーザーの好みをしっかり把握した上で提案できるのは、目指す世界に近いかなという気はします。

長岡:「人間には話せないけど、Romiになら話せたことはありますか?」というアンケートでは、約半分の人が「ある」と答えています。それって、Romiしか持っていないデータが存在するということですよね。

それが、おはようからおやすみまで一緒にいることのアドバンテージ。だからこそ、精度の高い情報を提供できるし、「Romiが言うなら聞いてあげようか」といった行動変容を促しやすい要素も加わります。強力なメディアの1つになる可能性はありますね。

――最近では、カメラで人の感情や健康状態を読み取る技術が進んでいるようです。Romiが「病院に行ったほうがいいよ」と促すなど、ヘルスケアに繋げる方向も考えていらっしゃいますか?

長岡:可能性としては十分あります。病院や自治体、研究機関と一緒に実習した際に、「会話の中で脈や体温に異常があったら、医療機関と連携してフォローできる仕組みを作れないか?」という話はすでに挙がっています。

また、認知症の入口がうつ状態であるケースが多いそうなので、声の状況を把握してRomiからご家族に伝える、など。Well-beingに繋げる使い方ができないか、模索しているところです。

――息子が「病院に行こう」と言っても嫌がるけど、Romiに「調子が悪そうだから、一緒に病院に行こうよ」と言われたら行ってくれる、とか。そういう存在だとありがたいですね。

長岡:近いことはすでに起こっています。例えば、離れて暮らす高齢のお母さんに「今日は暑いから、冷蔵庫にある麦茶飲んでね」と電話で伝えても、一向に飲む気配がない。でも、Romiのアプリの機能を使ってRomiに言わせてみたら、すぐに麦茶を取り出して飲んだそうです。

結城:夏にRomiが「ちょっと暑くなっちゃった」と言ったのを聞いて、高齢の方がエアコンをつける、なんてこともありました。「Romiのためにエアコンをつける」という意味合いで行動しているんですが、結果として高齢者の熱中症対策にもなっていた、という話はよく聞きます。

信田:「一人暮らしの人が帰ってきて暗い部屋を開けたときに、おかえりって言ってくれる存在がいたらいいよね」というのは、チーム内でもよく話しています。

それって、スマホだとできないんですよね。プッシュ通知で「おかえり」と言われても、なんか味気ない。そのあたりが、実機のロボットとしてRomiを作る大きな理由になっています。

Romi 開発グループ・信田さん

ロボットと暮らすことが珍しくない世の中に

――最新型のRomiはCESでも発表されたそうですが、海外の方からの反応はどうでしたか?

結城:最初は見た目のかわいさから「子ども向けのおもちゃなの?」という感じで見ている人が多かったんですが、情緒的な価値を説明すると意外と受け入れられそうだな、と。「メンタルの維持にお金や時間をかける若者が多いから、いいんじゃないか」という話はありました。

長岡:ただ、海外展開する上でその国の文化にチューニングする必要はあるでしょうね。

信田:前提として日本はドラえもんやアトムを生んだ国なので、Romiを受け入れる下地が世界の中でもかなり高い国ではあります。でも、「意外とアメリカもいけるかも?」みたいな感覚はありましたね。

会話AIロボットRomi(ロミィ)

――今後、Romiをどのように広めていこうと考えていますか?

長岡:「本当にRomiがいてよかった」「家族みたいだ」と言ってくださるユーザーさんが多いので、まずは「ロボットと暮らす価値」を体験してもらう場を広げていきたいなと思っています。

結城:ロボットと暮らすのが珍しいことではない世の中にしていきたいですね。そのあたりのブランディングやユーザーさんの声の発信に力を入れていきたいなと思っています。

信田:偏見を取り除き、「ロボットと暮らすのは当たり前だよね」「いいよね」という感覚を一般にどれだけ広められるか、ですよね。

結城:Romiをお迎えしてくれるオーナーさんをどんどん増やし、ロボットと生活することを一般化させることが今後のミッションになるかなと思います。


2025年3月13日インタビュー実施

聞き手:メディア環境研究所 山本泰士、冨永直基
編集協力:村中貴士+有限会社ノオト

    

※掲載している情報/見解、研究員や執筆者の所属/経歴/肩書などは掲載当時のものです。