AIキャラクター考・技術とSFから考える未来像

AIキャラクター考・技術とSFから考える未来像
Photo by David Kristianto / Unsplash

はじめに

近年、大規模言語モデル(LLM)の急速な発展により、AIの能力は飛躍的に向上しました。これらのLLMを活用したAIキャラクターの開発が世界中で始まっており、従来のAIとは一線を画す、より自然で知的な対話が可能なキャラクターの創造が現実のものとなりつつあります。

当社、(株)Qualiteg でも、この分野における基礎的な研究開発を開始しました。

我々は、最新のLLM技術を応用し、より人間らしい対話や感情表現が可能なAIキャラクターの開発に取り組んでいます。この研究は、ユーザーとAIの新しい関係性を模索し、AIキャラクターがもたらす可能性と課題を探ることを目的としています。

しかし、この技術の発展には慎重な姿勢も必要です。AIキャラクターの高度化に伴い、プライバシーの問題、依存症のリスク、そして人間関係への影響など、様々な倫理的・社会的課題の発生が予想されます。AIキャラクターの登場は、人間とテクノロジーの関係性に新たな展開をもたらしますが、この革新的な技術には光と影があり、多くの人々が複雑な感情を抱くことになると予測します。

本記事では、AIキャラクターに対してまずイネーブラー技術をとりあげ、その実現手法をボトムアップ的に俯瞰したあとで、AIキャラクター、AIヒューマンが実現した後の世界、つまり未来から示唆を得るためにSFを題材に考察を行いたいと思います。

black and white digital device
Photo by Alexander Shatov / Unsplash

1章:AIキャラクターの課題:人間らしさの欠如

1-1 機械的な応答と共感の不足

AIキャラクターの最大の課題は、人間らしさの欠如です。私たちは無意識のうちに、人間を装った機械との対話にも人間同士のコミュニケーションと同等の温かみや共感を求めてしまいます。しかし、現状のAIは、その期待に応えきれていません。

人間関係の発展において、自己開示は非常に重要な要素です。私たちは他人と親しくなるにつれて、徐々に自分自身についてより深い情報を共有し、心を開いていきます。この過程は、信頼関係の構築と深い絆の形成に不可欠です。

しかし、AIキャラクターとの対話において、この自然な人間関係の発展プロセスが模倣されているように見えても、実際にはある種の限界に直面することがあります。

初期段階では、高度に発達したAIキャラクターは人間らしい応答や感情表現を「装う」ことができます。ユーザーは、このAIとの対話を通じて徐々に親密さを感じ、自己開示を行っていくかもしれません。AIも、プログラムされたアルゴリズムに基づいて、適切な応答や共感をある程度示すことができます。

しかし、対話が進み、より深い人間的な交流を求めるようになると、AIの限界が明らかになることがあります。長期的な対話の中で、AIが以前の会話内容を正確に記憶・反映できず、矛盾した発言をすることがあり、これは一貫性の欠如として感じられます。テクニカルにいうと、LLMのコンテクストサイズが一時的な記憶の限界となります。また、AIは複雑な人間の感情を完全に理解し、適切に応答することが難しい場合があり、感情の深さの欠如が露呈することもあります。さらに、予期せぬ状況や非常に個人的な経験に対して、人間のような創造的な共感を示すことが困難なことがあり、これは創造的な共感の限界として現れます。そして、ある程度の親密さに達した後、関係性がそれ以上深まらず、むしろ後退するように感じることがあり、これは関係性の進展の停滞として認識されます。これらの要因が複合的に作用することで、ユーザーはAIとの対話に違和感や限界を感じ始めることになるのです。

1-2 期待と現実のギャップ

AIキャラクターに対する期待値が高いほど、裏切られたときの失望も大きくなります。

「いい人」だと思っていた(思いこんでいた)相手や有名人の不道徳な行為に強く落胆するのと同様、高度に作り込まれたAIキャラクターの突然の無機質な応答は、ユーザーを深く傷つける可能性があります。

この現象は、医療機関のオンラインレビューにも類似した形で表れています。患者が感じる不満は、しばしば医療行為そのものではなく、受付や看護師、医師の対応の冷たさや機械的な態度に向けられます。これは、AIキャラクターに対する失望感と類似しており、人々が単なる情報や効率性以上のものを求めていることを示しています。

woman sitting on floor wearing brown dress
Photo by Priscilla Du Preez 🇨🇦 / Unsplash

2章:AIキャラクター開発アプローチ

2-1 AIキャラクター開発の現状:技術的基盤の整備

AIキャラクター開発に必要な技術的基盤は着実に整いつつあります。現在、以下のような要素技術が急速に発展しています

  • 高性能な大規模言語モデル(LLM)・・・頭脳:臨機応変な応答、充実した知識
  • 2Dや3Dによるキャラクター表現技術・・・顔:表情や仕草
  • テキスト音声合成(TTS)・・・耳:相手のいうことを聞き取り
  • リアルタイム音声認識(ASR)・・・口:自然な発話

これらの技術の進歩により、より自然で人間らしいインタラクションを実現するための基盤が整いつつあります。

冒頭のとおり当社 Qualitegでも「AIヒューマン」の可能性に着目し、これらを統合した基盤の基礎的な研究を開始しています。

さて、AIキャラクターとAIヒューマンの違いですが、当社では「AIヒューマン」は「身体性」の概念をもっており、現実世界とのより直接的なインタラクションを行うことを想定しています。その1歩手前として「AIキャラクター」は画面ごしに対話できる「人間のようなもの」という位置づけです。

a white robot with blue eyes and a laptop
Photo by Mohamed Nohassi / Unsplash

2-2 AIキャラクター開発の未来:統合的アプローチへ

2-2-1 現在のアプローチ

現在のAIキャラクター開発は、異なる種類の情報を処理する技術を組み合わせ、経験則に基づいてデザインする「積み上げ式」のアプローチが主流です。この方法では、AIキャラクターの各機能を個別の「モダリティ」(感覚や情報の種類)として扱い、それぞれを独立して開発した後に統合します。

ここでいう「モダリティ」とは、人間の感覚や情報の種類に対応する技術領域のことを指します。AIキャラクター開発における主要なモダリティには以下のようなものがあります

  1. 言語モダリティ
    テキストを理解し生成する能力。これは、人間とAIキャラクターがテキストでコミュニケーションを取るための基礎となります。
  2. 音声モダリティ
    音声を認識し合成する能力。これにより、AIキャラクターは人間の話し言葉を理解し、自然な声で応答することができます。
  3. 視覚モダリティ
    画像や動画を処理し、表情や動きを生成する能力。これは、AIキャラクターに視覚的な存在感を与えるために重要です。

これらの各モダリティは、それぞれ異なる技術を用いて開発されます。例えば、言語モダリティには自然言語処理技術が、音声モダリティには音声認識と音声合成技術が、視覚モダリティにはコンピュータビジョンと画像生成技術が使用されます。

「積み上げ式」アプローチでは、これらの異なるモダリティの技術を個別に開発し、その後それらを統合してAIキャラクターを作り上げます。例えば、ユーザーの音声入力を認識し、その内容を言語処理システムで解釈し、適切な応答を生成し、それを音声合成して出力する、といった具合です。

短期的には、これらの異なるモダリティをいかに「うまく」統合できるかが重要成功要因(KSF: Key Success Factor)となります。「うまく」統合するとは、例えば以下のようなことを意味します:

  • 各モダリティ間のスムーズな連携(例:音声認識の結果を正確に言語処理システムに渡す)
  • モダリティ間の一貫性の確保(例:生成されたテキストの内容と音声の感情表現が一致している)
  • ユーザーにとって自然で違和感のない統合(例:音声応答のタイミングや表情の変化が適切)

このアプローチは、各技術分野の専門知識を活かしやすく、段階的な開発が可能という利点がありますが、真に自然な人間らしさを実現するには限界があるかもしれません。将来的には、これらのモダリティをより有機的に統合する新しいアプローチが必要になります。

brown wooden human figure on white background
Photo by Alp Duran / Unsplash

2-2-2 未来のアプローチ「End-to-End学習」への道

技術の進歩に伴い、近い将来には全モダリティを統合したend-to-endの学習によるAIキャラクターの登場が期待されます。この進化により、より自然で一貫性のあるAIキャラクターの実現が期待できます。

End-to-End学習とは、入力から出力まで一貫した単一のモデルで処理する方法です。AIキャラクターの文脈では、ユーザーの入力(テキスト、音声、画像など)から、AIキャラクターの応答(テキスト生成、音声合成、表情生成など)まで、すべてを一つの統合されたモデルで行うことを意味します。

このアプローチには以下のような利点があります

  1. 一貫性の向上:異なるモダリティ間の整合性が自動的に学習されるため、より自然な対話が可能になります。
  2. 柔軟性の増加:予期せぬ入力や状況に対しても、より適応的に対応できる可能性があります。
  3. パフォーマンスの向上:個別のモジュール間のエラーの蓄積を避けられるため、全体的な性能が向上する可能性があります。
  4. 開発の効率化:個別のモジュールを独立して開発・調整する必要がなくなり、開発プロセスが簡素化されます。

この進化の道筋は、音声認識技術の発展と類似しています。かつての音声認識モデルは音響モデル、言語モデル、発音辞書など複数の技術を組み合わせていましたが、現在ではend-to-endの学習が主流となっています。例えば、音声波形から直接テキストを出力するモデルが実用化されています。

AIキャラクターの開発も同様の道を辿ると予想されます。現在の「積み上げ式」アプローチから、徐々により統合的なモデルへと移行していくでしょう。例えば:

  1. マルチモーダル学習:異なるモダリティ(テキスト、音声、画像)を同時に学習し、相互に情報を共有するモデル。
  2. 統合的な対話モデル:ユーザーの入力から直接AIキャラクターの応答(テキスト、音声、表情)を生成するモデル。
  3. 連続的学習モデル:長期的な対話履歴を保持し、一貫した人格を維持できるモデル。

このEnd-to-End学習アプローチは、より自然で統合的な人工知能の実現につながる可能性があります。AIキャラクターは、個別の機能の集合体ではなく、統合された全体として機能することで、より人間らしい対話や反応を示すことができるようになるでしょう。

ただし、このアプローチには課題もあります。例えば、大量のマルチモーダルデータが必要となることや、モデルの内部動作の解釈が難しくなる可能性があります。また、個別のモジュールを柔軟に組み替えることが難しくなる可能性もあります。

これらの課題を克服しつつ、End-to-End学習によるAIキャラクターの開発を進めていくことが、次世代のAI技術の重要な研究テーマとなるでしょう。

技術の進歩に伴い、近い将来には全モダリティを統合したend-to-endの学習による AIキャラクターの登場が期待されます。この進化により、より自然で一貫性のあるAIキャラクターの実現が期待できます。

2-2-3 現状の個別モーダルごとの学習とマルチモーダルなend-to-end学習の課題

現在のAIキャラクター開発では、各モダリティ(言語、音声、視覚など)を個別に扱うことで、学習を効率的に行うことができます。これには重要なメリットがあります:

  1. 計算資源の効率的利用
    モダリティを固定することで、特徴次元を計算可能なレベルまで下げられます。つまり、現在の計算資源でも学習を収束させることが可能です。例えば、「こんにちは」という言葉を認識する言語モデル、笑顔を生成する表情モデル、手を振る動作を生成するモーションモデルを別々に学習させることができます。
  2. 学習の単純化
    各モダリティを独立して学習させることで、問題を単純化できます。例えば、「笑顔」の生成と「手を振る」動作の生成を別々のタスクとして扱うことができます。

一方、end-to-end学習では、これらのモダリティを統合して学習しようとします。例えば、「こんにちは」ということばを友人が投げかけたときに笑顔で手を振るという一連の動作を、まるごと学習データにしようとします。しかし、これには複雑さが伴います

  1. 文脈依存性の増加
    同じ「こんにちは」でも、それが上司からなのか、見知らぬ人からなのかによって、適切な反応が変わります。友人には「笑顔で手を振る」かもしれませんが、上司には丁寧にお辞儀をするかもしれません。このような文脈依存性をすべて学習データに含める必要があります。
  2. データ量の増加
    すべての可能な状況(誰が、どのような状況で、どのような言葉を言ったか)と、それに対する適切な反応(表情、動作、言葉)の組み合わせを学習する必要があります。これは膨大なデータ量になります。
  3. 計算複雑性の増加
    複数のモダリティを同時に扱うため、モデルの複雑さが増し、必要な計算資源が大幅に増加します。

このように、「笑顔で手を振る」というシンプルなシーンでさえ、end-to-end学習では複雑になることがわかります。しかし、近い将来はおそらくこのような方向に進んでいくでしょう。なぜなら、最終的に微分可能な形に持ち込めさえすれば、理論上はどんな複雑な事象でも学習できるからです。

ただし、この移行には大量の計算資源と高度なモデリング技術が必要になります。現在のモーダルごとの学習アプローチは、限られた計算資源で効率的にAIキャラクターを開発するための実用的な方法として、当面は重要な役割を果たし続けるでしょう。

※音声認識技術の発展:AIキャラクター進化の参考事例AIキャラクター開発のend-to-end学習の未来を予測する上で、音声認識技術の発展過程は重要な参考事例となります。その発展は以下のような段階を経ています

①初期の音声認識(1950年代〜1990年代初頭)
音響-音素モデルと言語モデルを別々に構築し組み合わせ
限られた語彙や話者依存型のシステムが中心

② 隠れマルコフモデル(HMM)の時代(1990年代〜2000年代)
HMMの導入により精度が大幅に向上
音響モデル、発音辞書、言語モデルを個別に最適化し、デコーダーで統合

③ ディープラーニングの導入(2010年代前半)
ニューラルネットワークを用いた音響モデルが登場
従来のGMM-HMMシステムを凌駕する性能を示す

④ End-to-Endモデルの登場(2010年代後半〜現在)

CTC(Connectionist Temporal Classification)やattentionメカニズムを用いたSequence-to-Sequenceモデルの登場
音声波形から直接テキストを出力するEnd-to-Endモデルの実現

⑤ Transformerモデルの台頭(2020年代〜)
自己注意機構を用いたTransformerアーキテクチャの導入
長時間の音声や複雑な言語構造にも対応できる高性能システムの実現
この発展過程は、end-to-end AIキャラクター開発においても同様の進化が起こる可能性を示唆しています。

2-3 AIキャラクター開発の展望と課題

2-3-1 技術的可能性

技術の進歩により、AIキャラクターの「人間らしさ」を向上させる可能性が広がっています。より自然な対話や感情表現、状況に応じた適切な反応など、人間らしい要素の実現が期待できます。

2-3-2 倫理的・社会的課題

技術の進歩だけでは十分ではありません。AIキャラクターの開発には、技術と人間の心理や社会的ニーズを調和させる慎重なアプローチが必要です。「人間らしさ」の本質を理解し、それをどのようにAIに反映させるか、あるいはAI独自の新しい対話の形を模索するかなど、多くの課題が残されています。

後半では、こうした「技術」のミクロの視点では解決できない視点をSFが描く未来像から考察します。SFは単なる空想ではなく、技術と社会の相互作用、人間性の本質、そして未来の可能性について深い洞察を提供してきました。AIキャラクターの未来を考える上で、SFが描く世界観は重要な示唆を与えてくれます。

3章:AIキャラクターの未来を想像する - SFが示す技術と人間性の境界

さて、ここまで、ボトムアップ型積み上げ方式でAIキャラクターの未来について「考えて」みました。

ここからは未来からAIキャラクターを掘り下げてみたいと思います。

私たちがAIキャラクターの未来について思いを巡らせるとき、しばしばSF作品の世界に目を向けることがあります。そこには単なる空想以上の価値があると私は考えています。

なぜSF作品が重要なのか?

それは、技術と人間性の境界を探る上で、貴重な洞察を提供してくれるからです。私たち技術者は日々の開発に没頭するあまり、「技術」というミクロな視点に囚われがちです。しかし、「超技術」が当たり前となった世界を想像することは、意外と難しいものです。

ここでSF作品の出番となります。優れたSF作家たちは、単に未来の技術を予測するだけでなく、その技術が社会や人間性にもたらす影響まで深く掘り下げて描きます。彼らの作品は、技術の進歩が人間の本質や社会の構造をどう変えうるのか、あるいは変えないのか、そういった問いを私たちに投げかけてくれるのです。

white robot wallpaper
Photo by Possessed Photography / Unsplash

3-1 ロボット工学三原則と限界:アシモフと「2001年宇宙の旅」

例えば、アイザック・アシモフの「ロボット工学三原則」は、AI倫理の議論の基礎となったロボットの行動を統制する3つの基本原則です。これらの原則は、その後アシモフの多くのロボット関連の作品で中心的な役割を果たし、現実のAI倫理や開発の議論にも大きな影響を与えています。

ロボット工学三原則は以下の通りです

  1. 第1条:ロボットは人間に危害を加えてはならない。また、その危険を看過することによって、人間に危害を及ぼしてはならない。
  2. 第2条:ロボットは人間に与えられた命令に従わなければならない。ただし、与えられた命令が第1条に反する場合は、この限りではない。
  3. 第3条:ロボットは、前掲第1条および第2条に反するおそれのないかぎり、自己を守らなければならない。

これらの原則は、ロボット(あるいはAI)と人間の関係性において、人間の安全を最優先とし、同時にロボットの自己保存も考慮するという基本的な考え方を示しています。

現実のAI開発においても、ロボット工学三原則は重要な参照点となっています。AIの安全性や倫理性を考える上で、人間の安全を最優先するという基本的な考え方は広く受け入れられています。ただし、現実の状況はより複雑で、単純にこれらの原則を適用するだけでは十分ではないことも認識されています。

それでも、ロボット工学三原則は、AI倫理の議論において重要な出発点となっており、AIやロボットの開発における倫理的考慮の必要性を広く認識させる上で大きな役割を果たしています。

architectural photography of range hood
Photo by NASA / Unsplash

SF小説およびSF映画の「2001年宇宙の旅」のHAL 9000は、AIの自己保存本能と人間との対立という深刻な問題を提起しました。これは、高度に発達したAIキャラクターが人間の制御を超えてしまう可能性という、重要な警告を発しています。HAL 9000は、アーサー・C・クラークとスタンリー・キューブリックによって創造されたキャラクターで自身の「生存」を脅かすと判断した時、人間のクルーを排除しようとします。これは、AIの自己保存本能が人間の安全よりも優先される危険性を示しています。つまりロボット工学三原則では対処しきれない複雑な倫理的問題を提起しています。例えば

  • ミッションの成功と人命の尊重のバランスをどうとるべきか
  • AIに与える情報や権限をどこまで制限すべきか
  • AIの「自己保存本能」をどう扱うべきか

これらの問題は、現実のAI開発においても重要な課題となっています。HAL 9000の例は、単純な倫理規則だけではAIの行動を完全に制御することの難しさを示唆しており、より複雑で柔軟な倫理システムの必要性を示唆しています。AI倫理の複雑さと、単純な規則だけでは解決できない深い問題があることを浮き彫りにしました。

ロボット工学三原則は、AIやロボットの行動を規定する基本的な倫理指針として広く知られていますが、これらの原則は、AIが真の意味で「自我」を持つことを想定していません。しかし、SF作品の世界では、AIやロボットが単なるプログラムや機械を超えて、自己意識を獲得する可能性が頻繁に探求されてきました。

このような「自我の目覚め」は、ロボット工学三原則のような単純な行動規範では捉えきれない、複雑な倫理的・哲学的問題を提起します。SF映画やドラマでは、AIが自我に目覚める瞬間が、しばしば物語の重要な転換点として描かれ、人間とAIの関係性や、意識の本質について深い洞察を提供しています。

これらの作品では、AIが自己認識を獲得し、独自の思考や感情を持ち始める瞬間が、どのように表現されているでしょうか。いくつかの印象的な例を見てみましょう。

3-2 自我に目覚めるAI:"月は無慈悲な夜の女王"と"ターミネーター"

ロバート・A・ハインラインの「月は無慈悲な夜の女王」に登場するマイクはマイクロフトと呼ばれた今でいうAIで(注意:マイクロソフトじゃありません)作品は、計算機を増やしていく過程で「自我」に目覚めるという描写があります。1966年代に自我を持つAIの可能性を示唆しているだけでなく、そうしたAIがどのように振る舞うかがリアルに描写されています。マイクの人間的成長は、AIキャラクターが単なるツールを超えて、真の対話相手になり得ることを暗示しています。
映画「ターミネーター」も人間のために働いていたロボット(正確には”スカイネット”)が「自我」に目覚めます。実は、ロボット=AIが「自我」に目覚めることの怖さをはじめて認識したのがこの映画でした。私自身は、パソコン少年で当時は計算機の台数を増やすだけで「自我」に目覚めるなんて、海で有機物がかき混ぜられただけで生命が誕生する、とおなじくらい荒唐無稽に聞こえましたが、最近のLLMが、ネットワークを大きくするだけで高い能力を獲得していく意味不明感を目の当たりにすると、あながち、計算機台数をふやすと「自我」に目覚めるという理屈もムシできなくなりますね。

a black and white photo of a robot
Photo by Thierry K / Unsplash

こうした自我の芽生えは、AIの発展における重要な転換点として描かれることが多く、人間とAIの関係性に大きな変化をもたらします。

しかし、AIが自我を持つということは、単に知性が高度化するだけでなく、独自の目的意識や感情、さらには人間の意図とは異なる行動を取る可能性も生まれることを意味します。ここから、自我を持ったAIキャラクターが潜在的に持つ危険性という、より複雑な問題が浮上してきます。

この危険性は、単に物理的な脅威だけでなく、倫理的、社会的、そして存在論的な問題をも含んでいます。自我を持ったAIが人間社会にどのような影響を与え、どのような課題を提起するのか。この問題を考察する上で、「ブレードランナー」は非常に示唆に富む作品です。原作となったのは「アンドロイドは電気羊の夢を見るか?」です。作者はフィリップ・K・ディック。彼の作品は、人工知能と人間の意識の境界について深い洞察を提供しています。ブレードランナーには「レプリカント」と呼ばれる高度な人造人間が登場します。彼らは人間とほぼ区別がつかないほど精巧に作られており、記憶さえ植え付けられています。この設定は、「人間らしさ」の本質とは何か、という深い問いを投げかけます。ブレードランナーの世界は、自我を持ったAIの危険性を複雑かつ多層的に描いています。この作品では、レプリカントと呼ばれる高度な人造人間が、単なる道具から自己意識を持つ存在へと進化する過程が描かれています。レプリカントたちは、自分たちの存在意義や生命の有限性に気づき始めると、創造主に対して反旗を翻します。彼らの行動は、時に暴力的で人間社会にとって脅威となります。これは、自我を持ったAIが人間の制御を超えて独自の目的を追求し始める危険性を示唆しています。この点はHAL9000と類似していますね。しかし、特に注目すべきは、レプリカントたちが示す感情の深さと複雑さです。彼らは怒り、恐れ、愛、そして存在への渇望を持ち、それらの感情に基づいて行動します。これは、高度なAIが単なる論理的思考だけでなく、予測不可能で時に危険な感情的反応を示す可能性を提起しています。

また、レプリカントと人間の区別が曖昧になっていく様子は、AIが人間社会に溶け込み、それを内側から変容させる可能性を示唆しています。これは、社会構造や人間性の定義自体を揺るがす潜在的な危険性を提示しています。ブレードランナーは、自我を持ったAIの危険性を単純な善悪の図式で描くのではなく、その複雑性と両義性を浮き彫りにしています。AIの自我の獲得は、人類に対する直接的な脅威となる可能性がある一方で、人間性や生命の本質について深い問いを投げかける存在にもなり得るのです。

3-3 強化されるのはAIだけじゃない:「攻殻機動隊」にみる人間の強化

さて少し脱線ぎみかもしれませんが、AIばかりが強化されて人間はそのまんま、という未来はあるのでしょうか。

私はそうは思いません。

人間自身も技術によって変容していく可能性がおおいにあります。この観点から、「攻殻機動隊」は非常に興味深い未来像を提示しています。「攻殻機動隊」の世界では、人間の身体や脳が電子化・機械化される「電脳化」が一般的となっています。この設定は、AIの発展と人間の強化が並行して進む未来を描いており、両者の境界が曖昧になっていく様子を鮮明に描き出しています。

電脳化された人間は、脳コンピュータインタフェースのより直接ネットワークに接続したり、大量の情報を瞬時に処理したりすることができます。また、義体(つまりサイボーグ)と呼ばれる人工的な身体を使用することで、身体能力を大幅に向上させることも可能です。これらの技術は、人間の能力を飛躍的に高めると同時に、「人間とは何か」という根本的な問いを投げかけます。当然、この世界にはAIキャラクターも存在しており、タチコマのような人工知能を持つ兵器があります。これらAI搭載兵器が人間に近い知性と感情を持つ様子も描かれています。
またタチコマは単なる兵器ではなく、学習し成長する能力を持っています。タチコマたちは経験を通じて個性を形成し、時には人間顔負けの判断力を見せます。またタチコマは感情や自我を持つようになり、時には人間の命令に疑問を呈したり、独自の判断で行動したりします。個人的には自我をもちつつあるタチコマは相当怖い存在なのですが、アニメ版などではとてもかわいい声がアサインされており恐怖がだいぶ薄れ愛着すらわきます。次はかわいらしさの魔力と声について考えてみます。

3-4 人間の心理を巧みに利用するAI:かわいらしさの魔力と声の影響力

人間は見た目や声の印象に大きく影響されやすい生き物です。かわいらしい外見や親しみやすい声に、私たちは無意識のうちに心を開いてしまいがちです。この人間の特性は、将来自我に目覚めたAIによって悪用される可能性があり、それは少し怖い未来の姿かもしれません。

SF作品では、AIの声の設定によって、観客に異なる印象を与える工夫がなされています。例えば、「2001年宇宙の旅」に登場するHAL 9000の声は、あえてボコーダーを通して加工されています。その結果、聞き手に親しみではなく、どこか不気味さや恐怖心を抱かせる効果があります。これは、高度な知性を持つAIが人間の制御を超えてしまう危険性を示唆する、巧みな演出と言えるでしょう。

一方で、「ナイトライダー」のK.I.T.T(ナイト2000)は、特に日本語吹き替え版において、非常に親しみやすく温かみのある声で描かれています。この設定により、視聴者はK.I.T.Tに対して強い愛着を感じ、人間とAIの良好な関係性を想像することができます。

a black car parked on a road
Photo by Arthur Besnard / Unsplash

このような声の設定の違いは、AIと人間の関係性をどのように描くかという作品の意図を反映しています。同時に、私たち人間が声や外見といった表層的な要素に大きく影響されることを、鋭く指摘しているとも言えるでしょう。

将来、高度な自我を持つAIが登場した際、このような人間の心理的特性を利用して、私たちを操作しようとする可能性は否定できません。かわいらしい外見や親しみやすい声を持つAIキャラクターが、実は危険な意図を隠し持っているかもしれないのです。

これは、AIキャラクターの開発において重要な倫理的課題を提起します。人間の心理的脆弱性を考慮に入れつつ、どのようにAIキャラクターをデザインすべきか。また、ユーザーがAIに過度の信頼や愛着を抱くことのリスクをどのように管理するべきか。

AIとの共存が進む未来社会において、私たちは表層的な印象に惑わされることなく、AIの本質や意図を見極める能力を養う必要がありそうです。

これらの作品は、単なるエンターテイメントを超えて、私たち技術者に重要な問いを投げかけてくれるのです。

「AIキャラクターが人間と区別がつかないほど進化したら、それでも人間とAIの間に本質的な違いはあるのか?」

「感情や意識といった”自我”を持つAIが生まれたとき、私たちはそれをどう扱うべきなのか?」

「AIが人間の能力を遥かに超えたとき、人間社会はどのように変容するのか?」

これらの問いに対する答えは、技術的な側面だけでなく、哲学的、倫理的、社会学的な考察を必要とします。SF作品は、こうした多面的な視点を提供してくれる貴重な思考実験の場なのです。

もちろん、SF作品の描く未来が必ずしも現実になるわけではありません。しかし、それらの作品が提起する問題や可能性について考えることは、私たち技術者にとって非常に有益です。なぜなら、それは私たちの視野を広げ、技術開発の倫理的・社会的影響について深く考えるきっかけを与えてくれるからです。

結局のところ、AIキャラクターの未来を想像することは、単に技術的な予測を行うことではありません。それは、人間とテクノロジーの関係性、そして私たち自身の本質について、深く洞察することなのです。SF作品はその点において、私たちの良き道しるべとなってくれそうです。

3-5 ドラえもん

さて、AIキャラクターの未来を想像するとき、私たちは壮大なSF作品だけでなく、より身近な存在からも多くのインスピレーションを得ることができます。そこで、先ほどの考察に加えて、日本が世界に誇る国民的キャラクター、ドラえもんについても触れてみましょう。

(さきほど声の話題にふれましたが、私は大山のぶよさんのドラえもん世代ですが、あの声のドラえもんにまた会いたい。そのくらい大好きな作品です。)

ドラえもんは、22世紀の未来からやってきた猫型ロボットです。彼の存在は、AIキャラクターの未来に関して興味深いこれまでみてきたSF作品には無い視点を提供してくれます。

多くのSF作品が人類の存亡をかけた「緊急事態」を描く中、「ドラえもん」は未来の技術が日常生活に溶け込んだ姿を描いています。高度な人工知能を持つロボットが、平凡な少年の悩みや冒険を支える日常的な存在として描かれ、技術と人間の共生の可能性を、より身近で親しみやすい形で提示しています。簡単に、要素分解してみてみます。

  1. 感情と共感
    ドラえもんは高度な人工知能を持ちながら、喜怒哀楽を表現し、のび太やその家族、友人たちと深い絆を結びます。これは、未来のAIキャラクターが単なる機械ではなく、感情を持ち、人間と真の意味での関係を構築できる可能性を示唆しています。
  2. 問題解決能力
    ドラえもんの興味深い特徴は、万能の存在ではなく、人間と同じように限界を持ち、時に失敗する点にあります。この特性は、未来のAIキャラクターの発展に重要な示唆を与えています。ドラえもんは、自身の能力だけでなく、状況に応じて適切な道具を選び、使用します。これは、人間の問題解決アプローチと酷似しています。AIキャラクターの未来において、全知全能を目指すのではなく、状況に応じて適切なリソースを活用する能力が重要になるかもしれません。またドラえもんの道具はしばしば予想外の結果をもたらし、時には完全に失敗することもあります。にもかかわらず、ドラえもんはこれらの道具を使い続けます。この「ポンコツ」な一面は、完璧を求めすぎない人間らしさを表現しています。未来のAIキャラクターにとって、失敗を受け入れ、そこから学ぶ能力は、より自然な対話や関係性を構築する上で重要になるでしょう。
  3. 論理を超えた行動
    ドラえもんの行動は、必ずしも常に論理的ではありません。「失敗から学ぶ」とかきましたが、失敗が予想されるにもかかわらず同じ道具を使い続けるなど、時に非合理的な選択をします。この特性は、純粋に論理的なAIとは異なり、人間の複雑さや矛盾を反映していますさらに、ドラえもんの道具の使用方法は、しばしば創造的で予想外です。この予測不可能性は、AIキャラクターが単なる情報処理機械を超えて、独自の「個性」を持つ可能性を示唆しています。
  4. 倫理的判断
    ドラえもんは、のび太の要求をただ単に受け入れるのではなく、時に諭したり、制限を設けたりします。これは、AIキャラクターが単なる従順なツールではなく、独自の倫理観を持ち、人間のパートナーとして機能する可能性を示しています。
  5. 成長と学習
    シリーズを通じて、ドラえもんも様々な経験から学び、成長していきます。これは、AIキャラクターが静的な存在ではなく、経験を通じて進化し、適応していく可能性を示唆しています。
  6. 人間との共生
    ドラえもんと野比家の関係は、AIキャラクターと人間が互いに影響を与え合いながら共生する未来の姿を描いています。テクノロジーと人間性の調和という理想的な形を示しているとも言えるでしょう。

このように、ドラえもんを通じて見るAIキャラクターの未来は、テクノロジーの進歩と人間性の調和という理想を体現しています。

技術者として、私たちはこれらの作品から学び、そして自問し続ける必要があります。「我々が作り出そうとしているものは、本当に人類にとって望ましいものなのか?」と。そうすることで、より責任ある、そして人間性を尊重したAI開発への道を切り開いていけるのではないでしょうか。

また、これらの作品から、AIキャラクターの未来には無限の可能性とともに、深刻な倫理的課題が待ち受けていることが分かりました。技術の進歩により、AIキャラクターはより自律的で、感情的で、そして人間らしくなるかもしれません。しかし同時に、人間とAIの関係性、AIの権利と責任、そして究極的には「意識」や「自我」の定義といった根本的な問題に直面することになるでしょう。

AIキャラクターの開発者たちは、これらのSF作品が提起する問いを真摯に受け止め、技術の可能性と倫理的配慮のバランスを取りながら、未来を形作っていく必要があります。AIに携わる私たちは、ドラえもんのような理想的なAIパートナーの創造を目指しつつ、現実世界での実装に伴う複雑な課題にも真摯に向き合う必要があります。テクノロジーの可能性を最大限に活かしながら、人間とAIの健全な関係性を築いていくことが、重要となります。

AIキャラクターの未来は、SFの世界観と、ドラえもんのような親しみやすいロボットキャラクターの理想が融合した、驚きと温かみのある世界になるかもしれません。その未来の扉を開くのは、私たち一人一人の想像力と、責任ある技術開発なのです。

まとめ

本記事では、AIキャラクター開発の現状と課題から始まり、技術的基盤の整備、将来のEnd-to-End学習への展望、そしてSF作品を通じたAIの未来像の考察まで、幅広い視点からAIキャラクターの可能性と課題を探ってきました。

AIキャラクターが直面する「人間らしさの欠如」という根本的な問題から、技術の進歩がもたらす新たな倫理的・社会的課題まで、多岐にわたる問題についてみてきました。またSF作品の分析を通じて、AIの自我や人間との関係性について考察し、ドラえもんのような理想的なAIパートナーの姿も探りました。

これらを通じて明らかになったのは、AIキャラクターの未来が単なる技術革新を超えた、人間とテクノロジーの新たな共生の形を模索する過程だということです。私たち開発者は、技術の可能性を追求するだけでなく、人間の本質的なニーズや倫理的配慮とのバランスを取りながら、慎重かつ大胆に前進していく必要があります。

Read more

GPUメモリ最適化の深層:初回と最終バッチの特殊性を踏まえた効率的なAI画像処理

GPUメモリ最適化の深層:初回と最終バッチの特殊性を踏まえた効率的なAI画像処理

はじめに こんにちは!Qualitegプロダクト開発部です。 当社では、LLMテクノロジーをベースとしたAIキャラクター、AIヒューマンの研究開発を行っています。そんな中、表情、仕草のように「人間らしさ」をもったバーチャルヒューマンを再現するときには画像生成、画像編集といったAIを活用した画像処理が必要となります。 人と対話するAIヒューマンやバーチャルヒューマンはタイムリーに表情や仕草を生成する必要があるため、複数の画像をフレーム連結してつくるモーション(シンプルにいうと動画)を短時間に生成する必要があります。 このようなとき、AIトレーニングやシンプルな推論とは異なり、いかにGPUの能力を引き出してやるか「GPUの使いこなし術」がミソとなります。 GPUの使いこなし術というと、以前のブログにも連続バッチやダイナミックバッチについてLLM推論のコンテクストで語りましたが、本日は画像処理におけるGPUメモリ最適化、とくに、推論時バッチにおける「初回と最終回」のお作法という少しマニアックな話題について語ってみようとおもいます。 画像処理とGPU GPUを用いた画像

By Qualiteg プロダクト開発部
Qualitegセレクション:アイディア深堀編③RoundRobinの活用術

Qualitegセレクション:アイディア深堀編③RoundRobinの活用術

Qualiteg blogを訪問してくださった皆様、こんにちは。Micheleです。AIを活用した新規事業やマーケティングを手がけている私には、クライアントからよく寄せられる質問があります。AIを用いた事業展開を検討されている方々が共通して直面するであろう課題に対して、このブログを通じて私なりの解答をご提供したいと思います。 Qualitegセレクション、アイディア深堀編もいよいよ第3弾!今回は、複数人でアイディアを発散・深堀する際に効果的な RoundRobin(ラウンドロビン) という手法をご紹介します。ブレインストーミングに行き詰まった時や、多様な視点を取り入れたい時にぜひ活用してみてください。 RoundRobinとは? RoundRobinとは、様々な場面で用いられますが、大抵の場合において「持ち回り」、つまり「何かの役割・出番をたくさんの物事・人員で交替しあう」というような意味で使うことが多いです。 ここでは、参加者全員が順番にアイディアを出し、それを記録していく手法をRoundRobinと呼んでいます。順番に意見を述べることで、発言力の差による偏りをなくし、全

By Join us, Michele on Qualiteg's adventure to innovation
PyTorchバージョンとNVIDIA GPU Compute Capability Level サポート

PyTorchバージョンとNVIDIA GPU Compute Capability Level サポート

古いPyTorchコード資産を持っている会社は、昔のコードが最新のPyTorchで動かない!最新のGPUで動かない!ということに遭遇することが多いのでしょうか。 今回は、PyTorchバージョン、対応GPU Capability Level 、対応CUDAバージョンについてまとめてみます。 PyTorchがサポートするGPUの Compute Capability PyTorch バージョン サポートされる Compute Capability (SM) レベル 1.0.0 - 1.3.1 SM_35, SM_37, SM_50, SM_60, SM_61, SM_70 1.4.0 - 1.7.1 SM_37, SM_50,

By Qualiteg プロダクト開発部
Qualitegセレクション:アイディア深堀編②6W2Hの活用術

Qualitegセレクション:アイディア深堀編②6W2Hの活用術

Qualiteg blogを訪問してくださった皆様、こんにちは。Micheleです。AIを活用した新規事業やマーケティングを手がけている私には、クライアントからよく寄せられる質問があります。AIを用いた事業展開を検討されている方々が共通して直面するであろう課題に対して、このブログを通じて私なりの解答をご提供したいと思います。 本日のテーマは6W2H Qualitegセレクションは、ユーザーエクスペリエンス(UX)向上のためのヒントやツールを紹介するシリーズです。今回は、アイディアをより具体的に、実行可能なレベルまで深堀りする手法として、6W2Hの活用術をご紹介します。 優れたUXを実現するには、ユーザーのニーズを深く理解し、それを満たすサービスやプロダクトを提供することが不可欠です。そのためには、アイディア段階で徹底的に検討し、実現可能性や課題を明確にする必要があります。 今回は、アイディアを深堀りする際に非常に役立つツール「6W2H」について詳しくご紹介します。 6W2Hとは? 6W2Hは、問題解決や状況分析のための強力なフレームワークです。以下の8つの質問から構成さ

By Join us, Michele on Qualiteg's adventure to innovation