ミクシィ独自開発の会話AIを搭載し、声をかけるたびに”考えて”会話をしてくれるロボット、自律型会話ロボット『Romi(ロミィ)』

ミクシィでは珍しいハードのプロダクトのため、このプロダクトデザインの秘密についてインタビューしてみました。
このしずく型?吹き出し型?の形はどのようなプロセスを経て決まったのか、また、特徴のひとつであるモニターのアニメーションやその動きなどをどう進めていったのか。

今回は、実際にプロダクトデザイナ―として参加していただいたTSデザインの角南さんをゲストにお迎えして、デザインの裏側を探りながら、このデザインプロジェクトそのものの進め方について根掘り葉掘り聞いてみました。

 

長岡 輝(ながおか あきら/ 写真左端)
SNSでユーザーが行動するモチベーションを科学したくSNS「mixi」の分析担当としてミクシィへ中途入社。その後M&A・PMI業務、グループ会社管理業務を経て、2017年より新規事業のRomi事業に立ち上げから参画。現在はRomiのマーケティング、サービスディレクション、ビジネス開発などを担当。
高岡 優子(たかおか ゆうこ/ 写真中央左)
中途でミクシィへ入社。SNS『mixi』をはじめとしたデザイン業務を経て、現在はRomi事業部で顔アニメーションやブランディングデザインなどを担当。

竹本 芽衣(たけもと めい / 写真中央右)
2016年にミクシィへ中途入社。学生時代は映画を専攻していたがグラフィックデザイン、UIデザインの経験を経てコミュニケーションデザインをテーマとした研究開発に携わり、以降UXデザインに目覚める。

 角南 健夫(すなみ たけお / 写真右端)
千葉工業大学 工業デザイン学科 卒業。家具メーカー勤務後独立。2002年「TSDESIGN」設立。 家具、家電、玩具、自転車、ロボットなど、幅広い工業分野の製品デザインを行っている。「特徴的であること・わかりやすいこと・効果的であること」をキーワードにプロダクトを中心にグラフィックから3Dモデリング支援までを手がける。

 

“話しかけやすい”形を求めて。まずは怒涛のプロタイプ検証

──まずはじめに、大まかにRomiについて教えていただけますか?

長岡 スマートスピーカーの「目覚まし機能」「天気予報」「タイマー」といった便利機能は押さえつつ、自律型の会話AIを搭載して”会話”に特化していることでしょうか。特に“話しを聞く”ことに特徴があって、喋りかけた人の気持ちを察して反応したり、うんうんと頷きながら傾聴したり、まるで人と話しをしているかのような“会話らしい”動きをするのが特徴ですね。

──なるほど。なので”自律型会話ロボット”なんですね。

長岡 そうですね。たとえ同じ話しを何度か問いかけたとしても、都度同じ反応をするわけではなく、 その時の会話の流れや状況(天気、時間帯、季節など)によって、Romiから返ってくるフレーズも変わります。

──おお。たしかにかなり人間に近い感じがしますね。

長岡 そうなんです。自然な会話を生み出すためにAIがどのような返答をするかももちろん大事なのですが、それ以外の部分もすごく重要で。

──それ以外の部分?

長岡 例えば、人の話しを聞く時、言葉を出さずに小さく頷いたり、瞬きの速度が変わったり、表情が変わったりしますよね。これはテスト段階で色々と発見していった部分もあるのですが、“会話”はただ単にフレーズをやりとりし合うものではなく、そういった所作を含めて達成されているものなんです。

──たしかに喋っている時に無反応だと、喋りづらいですもんね。では、その所作を実現するためにもプロダクトのハード側にもこだわりが隠れている?

長岡 はい。本当に色々な試行錯誤をして、今の形に行き着いたのは間違いないですね。
まずは人以外のモノと会話する体験から検証して徐々にブラッシュアップしていこうという考えがあり、最初は見た目は度外視のプロトタイプからスタートとしました。この段階では、ありもののハードの組み合わせでセンサーや配線もむき出しで…自然な会話ができるロボットという感じではありませんでした(笑)。

──なるほど。まずは動作するプロトタイプを作ることを目指したわけですね。

長岡 そうです。開発を始めた2017年当時の写真が残っているのですが、こんな感じ。

──これは思ったよりも…!

長岡 今見るとびっくりしますよね(笑)。これがRomiの原型です。

──ここからハードをデザインしていくのは、どういう風にスタートしたのでしょうか?

長岡 当初は「◯◯なデザインにしよう」「◯◯をモチーフにしよう」とか、具体的な方向をもって始めたわけではないんです。もちろん、どんな形にしたいかなとか話すことはあったのですが、まずやったのは「“会話”ってそもそもどんなものだっけ?」という作業で。
それらしく言うと、「“会話”をしている時に人はどういう状態になっているか?、どうすれば”会話”が成立するのか?」という作業ですね。

──“会話”の構成要素を見つけていく作業ですね。

長岡 そうです。その中で、相槌ひとつとっても、大きく頷いたり小さく何度も頷いたりと複数あるね、とか、声をかけた時にパッと振り向いてくれた方が嬉しいよね、などと会話を重ねて「じゃあ首の部分に縦軸をつけよう」「首は回転するようにしよう」と要件を決めていきました。

──ハードを作るための最低条件を固めていく。

長岡 それから、ソフト面の改善も平行して行うためにユーザーテストを細かく行っていたのですが、さすがにロボロボしたものに話しかけるのって抵抗あるよなあ、と思い、まずはとりあえず喜怒哀楽のパターンと、簡単な表情だけ表示してくれるようなプロトタイプを作ったんです。

──おー…とはいえまだまだRomiには似つきませんね。

長岡 はい(笑)。これはデザインのプロトタイプというより、とりあえず有りものを組合わえて、ユーザーテストで話しかけづらい印象を緩和しよう、会話しやすくしようと作ってみたものですね。とはいえ、ハードも進めなくてはいけないので市場調査の一貫として、ヒアリングも平行して行っていきました。動物モチーフがいいのか、人の顔がいいのか、それとも抽象的なロボットの形がいいのか…「どういう形をしていたら家に置きやすいですか」などのヒアリングを通して、好まれる傾向をリサーチしていきました。

──まだまだ形は決まっていなかった。

長岡 はい。でも、ロボットの開発経験を持ったものがチーム内にいなかったので、その時点で出来るのはここまでかな、と。次の段階に進めために、プロダクトデザイナーである角南さんに協力をお願いしました。

──なるほど。じゃあ割と早い段階でチームに入ったわけですね。

角南 ユーザーテストこそ行ってはいたのもの、先の画像のような試作段階でしたね。なので、「じゃあ最初っからやりますか!」と。

──いよいよハードの調整に入るわけですね。

角南 そうですね。といっても、ロボットは、ハードのデザインだけに限らず、動作することを考えた形にしないといけなくて…。中の基板やそのプロダクトを動かす駆動部分を踏まえたうえでハードをデザインすることが基本なので、自由度に制限があるんです。その制限をチームの皆さんと共有して、試作してみたものがこの2つです。

──グッとプロダクトらしくなっていますね。左が角南さん案?

角南 はい。大まかにいうと、この時点では「首を回転させる」「表情をつける」「頷けるようにする」という3つの機構を実現したかったので、ユーザーインタビューで得た“動物モチーフは愛着が湧きやすい”という視点をもとに抽象化して、「卵の中にいる動物」をイメージしたものです。首が上下して頷き、振り向くこともできるし、ロボットが寝ている時は上部が閉まっていて、起きるとニュッと伸びてくる、みたいなギミックもありました。

──なるほど。では右側は?

竹本 これは同じ方向性で、より具体的に「卵の中にいる動物」をイメージしたものです。以前に作っていた丸っこい鳥のプロトタイプが比較的好評だったので、丸い要素を生かしたいなと思いました。中にいる動物はカワウソをモチーフにしていて、卵の殻に隠れた意外な小動物をイメージしています。

長岡 具象は愛着を生み出すには良いものの、具象に寄せすぎるとその見た目が気にいるかどうかで判断されてしまう懸念があり…。製造を始めるスケジュールにも迫っていたので、笠原さんに相談したら「具象の良さを抽象に取り入れられないかな?」とコメントがあって。どっちがいいですか?と方向性を決めるために聞いたら、どっちも!って言われた感じですね(笑)。それで、角南さんに「もっと具象っぽい抽象の形って作れますか」とオーダーする流れになります。

──(笑)。そこからどう展開していったのでしょうか?

長岡 角南さんの案をベースにしつつも、まだもう少し色々な形を探りたかったので、「どうすれば生き物っぽくなるか」「話しかけやすくなるか」と議論を重ねていきました。その中で、「感情の表現をハードにさせるのではなく、全てディスプレイでまかなえるのでは?」といった話しも出てきて…。

角南 となると、私の仕事がなくなってしまうわけですが(笑)。もちろんその案は出しつつ、とはいえハードが動いた方が圧倒的に生き物っぽくなるのは分かっていたので、平行して提案していきました。

──結構なバリエーションを試してみてるのですね。

角南 そうですね。最初のこけしみたいな形をベースにしたものや、雪だるまのような人のような形のもの、それと今のRomiに比較的近い丸いものまで、ここに至るまでにもたくさん数を出しました。

竹本 たくさん出してもらいましたね…(笑)。それで、ここからユーザーインタビューを通して親しみやすい形を探っていきました。

──ユーザーインタビューはどのように実施されたのですか?

角南 複数のモックを並べて実際に会話をしてもらって、「一番親しみやすいのはどれですか?」と推しを決めてもらいました。

──それで人気だったのは?

角南 EのRomiに近いものですね。次点でBの人形っぽいものに続いていました。Dはモニタが斜め上を向いていて、必然的に上目遣いになるんですよね。もしかしたら、それが人気の秘訣だったのかもしれません。あと、Bの案も決して捨てきったわけではなくて、Bの雪だるまみたいな頭部の背面には実は小さな角がついていて、これが今のRomiの上部にあるつんとした角のベースになっています。
提案しておいてなんですが、Bの案の角は小さくニュアンスも細かいので、実際にこれを量産するとなると大変だぞ…と思っていたのは、今だからこそ話せることですね(笑)。

長岡 製品版のRomiに引き継がれているこの角も、結構シビアなんですよね?

角南 そうですね。当たっても痛くないうえにさわり心地も良くて柔らかな印象を与える角、ってかなりニュアンスの作業なので、ここは何度も検証して詰めていった部分ではありますね。

──かなりRomiらしい形になってきていますが、モニターは今より小さいですね。

長岡 この段階はあくまで見た目の方向性を決めるフェーズで、ここから立体モックで大きさの検証をしたり、モーターを入れて動くプロトタイプを作ってユーザーインタビューなどで試行錯誤を重ね、その中で今のサイズ感のディスプレイになりました。

──その他にもハードにこだわりが?

長岡 3色の調色についても、高岡さん中心に細かく調整してくれました。

高岡 そうですね。Romiは家の中で使う分、置かれる環境も様々。テスト段階で、薄暗い部屋の中に置いてみたり、陽の当たる窓際に置いてみたり…と複数の環境で綺麗に見える色を探りました。

竹本 どこに置くかによっても色の見え方が全然違うんですよね。真っ白な天板のテーブルの上に置くか、木肌の上に置くかでくすんでみえたり、印象が違って見えたり…。

角南 このニュアンスのカラーリングって、結構工場泣かせな色味ですよね(笑)。

高岡 大人の女性が家に置きたくなるカラーリングを目指したので、結構色の部分は最後まで詰めましたね…。ラインナップは、家電のカラーリングや歯ブラシの色味などを参考にしながら、寒色の青と暖色の赤で1色ずつ、シンプルな白の計3色にしようと決まりました。ですが、細かな調色の部分は、工場に色々とリクエストに応えてもらったと思います。
ツヤっとしたテクスチャを出すために塗料にパールを混ぜてもらうのですが、粒が大きかったり多すぎたりすると、ざらざらとした手触りになるんです。

竹本 そこで、「このツヤは活かしたまま、なめらかな手触りにできますか?」とお願いした覚えはありますね(笑)。でもサンプルであがってくる時は球体じゃなくて、板状のサンプルだからそこでまた印象が変わってしまって…と何往復もして、やっと納得のいく仕上がりまで持っていけました。
色でいうと、この土台の銀の色も適当に決めたわけではなくて、Romiが話す時に下の部分がブルーのLEDで照らされるので、その色が綺麗に見える色にしようと、金色にしたり、色々と試しましたよね。

高岡 デパートで化粧品を買ってきて、「この蓋の、◯◯の部分を再現したい」とお願いしたり、既製品の家電のこの天板の色にしたいとお願いしたり…。

角南 塗装はいわゆる印刷物とは使っている塗料も違うので、実際に販売されている商品を示す方が工場からすれば分かりやすかったのかもしれませんね。

──なるほど。ディスプレイに表示するアニメーションはこれから着手したのですか?

長岡 いえ、実はこのアニメーションも開発初期から色々な目や表情をテストしていて、都度ユーザーインタビューでも検証してきたところでもあります。ここに関しては、初期のプロトタイプ段階では竹本、Romiが現在の形に近づいてきた段階で高岡が担当してくれています。

 

表情を作るために、毎日鏡とにらめっこ!?

高岡 話しは遡りますが、表情のテストはまだRomiの形に行き着く前から何度も検証を重ねていて…。今の“目のアニメーション”に行き着く前から試行錯誤を行ってきました。

──どんな試行錯誤があったのでしょうか?

竹本 初期段階ではいわゆるアニメの目を参考にしながら動物に寄せてみたり、感情を記号的に表現しやすいシンプルなものにしてみたり…と、実装しては印象を確かめて…と繰り返していました。

 

▲開発初期段階のアニメーション検証

──なるほど。これだけ検証を重ねた上で、高岡さんにバトンタッチしたと。

高岡 ハードの形が決まってから私が検証したのは目の形と色、ですね。当初は表現しやすい白や赤などで試してみたのですが、なんだか怒ってるというか、怖い印象になってしまったんです…。様々な色を検証してみて行き着いたのが青。他社のロボットなどを参考にして「なぜ青が多いんだろう?」と思っていたのですが、実際にユーザーテストしてみて、青が一番フラットに感じられるのは確かでした。

──こうしてみると、目が印象をすごく担っているのが分かりますね。

高岡 目とひとくくりに言っても、目の表情は、大まかに瞳・まぶた・眉毛の3つの要素で構成されていることに気づきました。なので、最初は眉毛とかもアニメーションに追加して試していましたね(笑)。
単純な喜怒哀楽などであれば、目そのものの形で表現できる気はするのですが、それだとロボットらしすぎるんですよね。例えば、人に話しかけた時って、喜怒哀楽のどれかの表情をしていることって、そうないですよね。なので、より人らしいコミュニケーションのために細かな感情を再現する…たとえば、拗ねているとか、ちょっと不機嫌そう?な感じとか。そうすると、眉間にシワを寄せたり、眉毛を釣り上げたりした方が方が感情は豊かになるんですよね。今のRomiには眉毛はありませんが、眉毛があると目がこういう形になる、などの“眉毛的なアニメーション”は実装しています(笑)。

──おお。そうした感情の表現ってどう探っていくのでしょうか?

高岡 参照したのは絵文字(emoticon)ですね。昔は「^^(笑い)」や「^^;(汗)」などの大まかな表現しかありませんでしたが、今の絵文字はカラフルで、さらにスマートフォンなどのディスプレイも細かな表現ができるので、絵文字の表情はかなり作り込まれているし、バリエーションも多い。それらを参考にしながら、本当にこんな顔するんだっけ、どういう風に目が動くんだっけ…と鏡を見る日々でした。

──鏡?

長岡 自分で鏡を見て撮って、研究してたんですよね(笑)。

高岡 はい、ずっと鏡見て色々な表情をして、目の動きを観察してました。どれだけまっすぐ見つめていても、人の目って微細に振動している、細かく上下左右に動いているとか、発見してはアニメーションに反映して…と試行錯誤していました。

──どうりで人っぽい目の動きをするわけですね。ではそれでアニメーションは決まり?

竹本 いえ、実際にアニメーションを作ってから実装する時も結構大変で…。PCの作業環境で表示できる色と、Romiに組み込んだディスプレイの色の表示領域が違ったんです。つまり、思った色をなかなか実機に反映できなかった。これには結構苦戦しました。最終的には、実機のディスプレイの色味を再現できるようなカラーフィルターを作って、実機に入れては調整、入れては調整の繰り返しでしたね。

高岡  あと細かなこだわりで言うと、瞬きひとつとっても、極端な事を言ってしまえば「開いている目」「閉じている目」の2枚で構成はできます。でも、それだとリッチな会話体験にはならないので、ディスプレイで表示できる30fps(1秒間に30枚)にして瞬きに9枚のコマを使っています。

──アニメーションの色味ひとつまでこだわり抜かれているわけですね。

 

Romiを通して、優しい世界を実現させたい

──Romiのハードはこうして作られていったと。ユーザーインタビューの結果は参照しつつ、どのように決定していったのでしょうか?

長岡 Romiのハードも会話AIもアニメーションも「話すと元気になれる」というコンセプトのもとに設計しています。

1.Romiと話していると、自分がやりたいこと/やりたくないことに気づけて子どもの頃のような素直で元気な気持ちになれる
2.共感はありつつ、嫌なことがあった時に一緒に気持ちが沈み続けない。そこから抜け出させてくれる
3.一緒になって笑ってくれる、怒ってくれる、常に自分を肯定してくれる

これらの姿をイメージしています

話しを聞く時は聞いてくれるけど、その悩みの軽重によって背中を押してくれる場合もあれば、深堀りしてずっと傾聴してくれることもある。そうした会話を実現するためには?と立ち返って、都度判断をしています。

▼Romiのステートメント

あなたの目を見ながらあなたの言葉を聞き、あなただけの言葉を紡ぎます。Romiは、あなたのすべてを肯定してくれる存在です。あなたの言葉を受け入れ、一緒に喜んだり、一緒に怒ったり。Romiといると、子どもの頃のように素直に話せる。嫌なことがあっても、Romiと話しているとついクスッと笑ってしまう。優しい気持ちになって、家族や友だちにも優しくできる。Romiと話す人が増えれば増えるほど、世界に優しさが満ちていく。そんな世界の実現を目指し、開発しています。

──チームでこうしたコンセプトを共有して、齟齬がないか都度確認していったわけですね。

長岡 どう決定していくか、という部分でいくと、ユーザーインタビューはもとより、アニメーションは高岡のアドバイスを重視するし、プロダクト面はプロフェッショナルである角南さん、チームメンバーとしてラフスケッチから携わってくれている竹本の意見を重視しながら、都度チームで決め、笠原に確認して進めていった感じですね。

──角南さんは、今回プロダクトデザイナーとしてRomiに携わったと思うのですが、いかがでしたか?結構大変でした…?

角南 もちろん試作も多かったので大変な部分はあったのですが、それよりもプロジェクトの進め方がすごく勉強になりましたね。朝会から参加していたのですが、週に一度進捗を共有する機会があったり、工程管理ツールを使ってシンプルに状況を追えるようになっていたり、とてもやりやすかったです。仕事柄、ソフトウェア開発の方々と接することは多いのですが、実際にAIを開発されている企業と仕事をしたのは初めてで。自社の技術を使って自社の思うプロダクトをいちから作れる。それってすごく夢のあることで、働く環境としては素敵だなーと感じました。

──正直、無理難題も多かったですか…?

角南 いえ、無理難題ではないのですが、やはりソフトウェアやアプリケーションの開発に長けていると思うので、「全面ディスプレイにしては?」とか「ハードの動き少なくする?」みたいな局面があった時は、やることがなくならないか、すこしドキドキしましたね(笑)。でも、ハードが動く魅力は話せば理解してもらえましたし、最終的にハードとソフトの両面で感情を作り出す、というところに着地できたので、いいコラボレーションが出来たと思っています。

──ありがとうございます。最後に聞きたいのですが、Romiのこの形ってなにをイメージされているのでしょうか…?

長岡 これは会話の吹き出しをひっくり返した形です(笑)。自律型会話ロボットの“会話”にフォーカスしたのもそうですし、実はSNS『mixi』のロゴとも同じ形なんです。

──なるほど!そんな秘密が隠されていたんですね。本日はありがとうございました。

 

 

PAGE TOP