今、世界中で急速に広がっている「生成AI」。
2022年にリリースされたOpenAIの「ChatGPT」は日本でも話題になり、その後、様々な生成AIが開発され、2023年は「AI元年」と呼ばれました。
海外だけでなく、日本の企業や自治体でも活用され始めている「生成AI」は、2024年に本格的に活用フェーズに入っていくと言われています。
しかし、今現在、仕事で実際に使っているという方はまだ少ないのではないでしょうか。
今回は活用フェーズに入る前に知っておきたい生成AIができることと、代表的な生成AIサービスをご紹介します。
生成AIとは

機械学習のモデルの一つで、学習済みのデータを活用してオリジナルデータを生成するAIのことを言います。
主にテキスト、画像、音声、動画などが生成でき、専門知識がなくても利用できることから近年注目を集めています。
従来のAIは「学習済みのデータの中から適切な回答を探して提示する」のに対し、生成AIは「ディープラーニング(深層学習)」という手法で、AI自身が学習し続け、人が与えていない情報やデータもインプットしながら、新たなアウトプットを人間に返すことができます。
2022年11月に米国OpenAIがChatGPTを一般公開して以降、生成AIの開発と活用が急速に進みました。
OpenAIが2023年11月に開催した開発者会議での発表によれば、ChatGPTの週間アクティブユーザー数は1億人に達しています。
また、Googleが2023年12月、テキスト・音声・画像・動画・コードなどさまざまな種類の情報を理解し、操作するマルチモーダル生成AI(Gemini)を発表し、国内でも国産生成AIの提供を近く予定するなど、国内外での開発競争も加速しています。
生成AIでできること

ここでは生成AIでできることを解説します。
テキスト生成
テキスト生成AIは、フォームに入力した「プロンプト」と呼ばれる文章を送信すると、自動的にテキストが生成されるAIのことです。
代表的なものとしてはOpenAIが開発した「ChatGPT」があります。
テキスト生成AIを活用すると、長文を要約する、キャッチコピーのアイデア出し、プログラミングのコード生成など、さまざまな作業を自動化できます。
ChatGPTなどを始めとする生成AIには通常の会話のように指示を出すことができます。
そのような自然言語による指示を「プロンプト」と呼びます。
更に生成AIをより上手に使うためのプロンプトの書き方があり、そのようなプロンプトの構成の仕方を「プロンプトエンジニアリング」と呼んでいます。
マイクロソフトは、2023年11月よりMicrosoft 365に生成AI「Copilot」を搭載しており、OfficeとCopilotを併用することで、ホワイトカラーの業務が一気に効率化することが期待されています。
例えば、Wordで書いた文章の校正だけでなく、読みやすくするための提案をさせたり、表データの高度な統計分析が簡単にできるようになります。
画像生成
画像生成AIは、テキストで指示するだけで、イメージに近いオリジナル画像を生成できるAIです。
2022年8月に、画像を生成できる「Midjourney」が登場して大きな話題となり、生成AIのブームが始まりました。
Midjourneyは、手軽に誰でも使うことができるのにも関わらず、人が書いたものと遜色ないアートを作り出すことができます。
すでにMidjourneyを用いて描かれた絵がある美術コンテストで優勝したり、複数のAI画像生成サービスによって生成された絵を載せたイラスト集が発売されるなど、すでに世の中で大きな反響を呼んでいます。
この他、画像生成AIでは「Stable Diffusion」も有名です。
動画生成
まだまだ進化の過程にありますが、画像生成AIと同じようにプロンプトを入力するだけで動画を生成してくれるAIが登場しています。
将来は、CM映像なども生成できるようになる可能性があり、期待が高まっています。
音声生成
音声生成AIは、音声入力やテキスト入力を基に新たな音声を生成する技術です。
例えば、ある一人の声を大量に学習させると、その声質と全く同じ声でさまざまな文章を自由に話す音声を生成します。
すでにニュースの読み上げやナレーションなどに応用が始まっています。
マルチモーダルAI
マルチモーダルAIとは、テキスト・画像・音声・動画など、人間の脳のように複数の種類の情報(モーダル)を一度に処理・解析できるAI技術です。
従来のAI技術は「シングルモーダルAI」と言って、テキストや音声など1種類の情報だけを処理することが可能でした。
これに対しマルチモーダルAIは、複数のデータ形式を統合して高度な生成が可能となっています。
ChatGPTは従来、テキスト生成のみに対応するシングルモーダルAIでしたが、2023年12月のGPT-4V実装により画像解析機能と音声出力機能が追加され、マルチモーダルAIになりました。
また、Googleの「Gemini」もマルチモーダルAIに分類されます。
代表的な生成AIサービス

①ChatGPT
ChatGPTとは、会話形式でやりとりができる生成AIです。
生成AIと言えば、ChatGPTを思い浮かべる人も多いでしょう。
ChatGPTは質問に答えるだけでなく、それまでの会話からどのような情報がほしいのか推測し返答することもでき、人と話しているような自然なやり取りができるのが特徴です。
ユーザーの指示に基づき、質問への回答や文章の要約/翻訳、メールや企画書の文書作成などの幅広い知的作業を自動で行うことが可能です。
ChatGPTは、アメリカのスタートアップ企業のOpenAI社により、2022年11月にリリースされました。
その後、リリースから5日間で100万人、2ヶ月で1億人と世界最速でユーザーを獲得したサービスとなり、大きな注目を集めています。
②Copilot
Copilotは、MicrosoftがブラウザやWindow OS向けに提供しているAIチャットアシスタントです。
Microsoftの提携先であるOpenAIのAIモデル「GPT-4」や「DALL-E 3」を搭載し、文章生成や対話を行うことができます。
さらに、Microsoft 365と組み合わせた「Copilot for Microsoft 365」では、普段利用するWordやPowerPoint、ExcelとCopilotが連携し、Copilotがアシスタントとなって文書やプレゼン資料を作成することができます。
また、Microsoft Teamsのチャット画面より、 Copilot と1対1の対話型式でMicrosoft 内のすべてのデータから関連するファイルや文章を抽出し、チャットで返答をもらうということが可能です。
③Gemini
Geminiは、Googleが2023年12月に発表した対話型AIです。
文章だけでなく、画像や動画、音声も理解できる「マルチモーダル機能」を備えている点が特徴で、複雑な数学の問題やプログラミング言語の理解など、難しいタスクもこなすことができます。
Geminiは性能に応じて3つのモデル「Gemini Ultra」、「Gemini Pro」、「Gemini Nano」があります。
最も性能の高いGemini Ultraは、数学、物理学、歴史、法律、医学、倫理など、あらゆる科目の知識・問題解決能力テストで人間の専門家を上回るパフォーマンスを発揮したと発表されているほどです。
そのため、GoogleのGeminiは、ChatGPTの有力な対抗馬として注目されています。
④Midjourney
Midjourneyは、日本でも多くのユーザーに利用している最も有名な画像生成AIです。
チャットアプリであるDiscord上で利用でき、単語や文章などのテキストを入力するだけで簡単にハイクオリティな画像を作成することが可能です。
日々バージョンが更新され、よりクオリティの高い画像を生成できるようになっており、アニメやマンガのイラスト作成やプレゼン資料の作成など様々な場面で活用することができます。
料金プランは、10ドルから120ドルまで複数用意されており、使う頻度や目的によって自由に選択することができます。
そのため、気軽に画像生成を使ってみたい方や、本格的に仕事で使いたい方のどちらにもおすすめのサービスとなっています。
⑤Stable Diffusion
Stable Diffusionは、イギリスのAIベンチャーStability AIが開発、提供している画像生成AIです。
Stable Diffusionの特徴として、オープンソースとして無料で公開されている点が挙げられます。
これは、「誰もが自由にAI技術を活用できるようになるべきである」というStability AIの考えがあるためです。
その結果、多くの利用者から支持を集め、一気に知名度が上がりました。
無料で使えるため、AIツール初心者におすすめのサービスです。
⑥VALL-E
VALL-Eは、Microsoftがリリースした、わずか3秒間の音声サンプルから人の声を再現できる音声合成AIです。
テキストを読み上げるだけでなく、抑揚やトーンも調整したより人間に近い自然な音声を生成できる点が特徴です。
メインの言語は英語ですが、最新版であるVALL-E-Xを用いれば、日本語の音声を英語に変換して再現することが可能となります。
カスタマーセンターでの顧客対応や動画コンテンツの制作、学習教材など様々な場面で利用することができます。
⑦VOICEVOX
VOICEVOXは無料でテキストの読み上げ、歌声合成のできる生成AIです。
文章を入力し、テキストを読み上げてくれるキャラクターを選ぶだけで手軽に音声生成ができます。
特徴としては、AIのディープラーニングによりイントネーションの調節も可能である点、アニメ調のキャラクターにテキストを音読させることができる点、オープンソースで構築されており様々なアプリやツールとの連携が可能である点などが挙げられます。
音声生成AIを初めて使う人や、YouTube用の解説動画を作りたい人に向いています。
⑧Sora
Soraは、CahtGPTのOpenAIが2024年2月に発表した動画生成AIです。
テキストでプロンプトを入力するだけで、最長1分間の動画を生成できます。
SoraのWebサイト上では50以上のサンプル動画が公開されており、実際にドローンやカメラワークで撮影したものと見分けがつかないほどのクオリティを実現しています。
特に、水の流れや窓に反射する景色など、物理法則を正しく反映した映像はAIの専門家をも驚かせています。
Soraは、まだ一般の方が利用することはできませんが、近い将来、映画制作やプロモーション動画作成などあらゆる場面で利用されると言われています。
私達の働き方はどう変わる?

ここまで、どのような生成AIがあるか紹介してきましたが、仕事で活用する場合、具体的にどういったことができるのでしょうか。
以下で、具体的な業務での活用方法をご紹介します。
定型業務の効率化・自動化
会議の議事録の作成、質問にメールで返答する、複雑なデータの可視化、文章の要約、校正といった定型業務は多くのビジネスマンが日常的に行っています。
このような定型業務は生成AIを活用することで、大幅に効率化・自動化されるでしょう。
例えば、営業職の場合、自社の製品やサービスが、顧客の困り事を解決したり、要望をかなえることができるといった提案をするためには、様々な準備をする必要があります。
具体的には、
- 営業先をピックアップする
- 市場動向などのデータ集計&先方のニーズに合わせた提案資料の作成
- 営業メール作成・送信
- 先方にプレゼンを行う
- 成約したら契約書作成
調査や資料作成のドラフト作りは生成AIが得意とするところであり、こういった「下準備」にあたる部分は、生成AIに任せることで業務を効率化することが可能です。
コンテンツ制作の低コスト化
社内で様々なコンテンツを制作しなければならない場面は多くあるかと思います。
例えば、サービスのホワイトペーパーを作る場合、特徴をわかりやすく説明する文や一目でわかる表、イメージを膨らませるための画像などが必要になるでしょう。
従来、このようなコンテンツを制作するには、プロに外注することが大半でした。
しかし、生成AIを使うと外注に依頼せずとも、社内で質の高いコンテンツを生成できるようになります。
また、修正も非常に簡単であるため、スタッフの意見を取り入れてどんどん修正することで、質を高めることが可能です。
クリエイティブな業務の補助
生成AIはクリエイティブな業務のアシスタントにもなります。
例えば、テキスト生成AIに尋ねることで、さまざまなアイディアを提案してもらうことができます。
アイディア出しは従来、誰かに話したり聞いたりすることで、アイデアを深めたり、新しいアイデアを生み出したりしていましたが、生成AIは、人間とは異なる視点や思考パターンを持っているため、今後は生成AIを活用したアイディア出しも浸透していくでしょう。
生成AIを使用する注意点

私たちの業務を効率化・自動化してくれると期待されている生成AIですが、利用する際には注意も必要です。
真偽の確認
生成AIを利用する際、特に注意すべき点の一つが「アウトプットの真偽」です。
生成AIは大量のデータから情報を生成しますが、そのアウトプットには必ずしも正確性が保証されているわけではありません。
例えば、古いデータや偏った情報源に基づいて生成された内容には、時代遅れや偏見を含む可能性があります。
そのため、生成された情報をそのまま利用するのではなく、人が内容を検証し、必要に応じて修正することが重要です。
著作権、商標権などを侵害してないか
生成 AI を利用する際、アウトプットが肖像権や著作権などの法律に違反していないかを確認する必要があります。
生成AIは、既存のテキスト、画像、音声データを元に新しいコンテンツを生成しますが、既存の作品を不適切に使用してしまう可能性があります。
例えば、特定の人物の肖像を無断で使用したり、著作権で保護されている文献や芸術作品を引用したりするケースも考えられ、法的な問題を引き起こす恐れがあります。
そのため、利用する場合はAIが生成したコンテンツがこれらの権利を侵害していないかを慎重に確認し、必要に応じて許可を取るか、代替のコンテンツを使用するなどしましょう。
情報が流出するおそれ
生成AIに情報を入力する際も注意が必要です。
日本ディープラーニング協会のガイドラインでは、個人情報・秘密情報・機密情報といった、いわゆる『秘匿性の高い情報は入力しない』ように呼びかけています。
利用者が入力したデータは、AIのモデル学習に利用されることがあります。
秘匿性の高い情報を入力してしまうと、生成AIのサービスを提供している会社や他の利用者にも情報の内容が流出する恐れが指摘されています。
個人情報や機密情報などを扱う機会の多い方は特に注意が必要です。
まとめ
今回は活用フェーズに入る前に知っておきたい生成AIができることと、代表的な生成AIサービスをご紹介しました。
- 2024年は生成AIが更に進化する
- 生成AIを使うことで、業務の効率化やクリエイティブなサポートが期待できる
- 生成AIを使う際は、真偽の確認や利権侵害に注意しよう