birabiraのめも

忘れっぽいのでここにメモをしていきます

最近の生成AIがすごすぎる話

はじめに

この記事では最近は台の生成AIについて私が最近調べたこと、知っていることをブログとしてまとめておこうと思います。私は自称セキュリティエンジニアなので、直接業務で生成AIを活用することはないのですがあまりにも面白くて趣味で調べています。

この記事の内容

  • 最近調べた生成AIについて読み物的に書いてます
  • ざっくばらんに殴り書き
  • とはいえ、なるべく端的に箇条書き
  • ただしAIにめちゃめちゃ詳しいわけではないので間違った理解があるかも

気になったもの

生成AIの種類

  • 生成AIには多くの種類が存在しています
  • 例えばOpenAIのGPT-4や、GoogleのPaLM2(Bard)、MetaのLLaMAなどがあります
  • 基本的にはGoogleが開発したTransformerという自然言語処理がベースになっています

生成AIの仕組み

  • 大量のコンテンツを学習して、与えられたプロンプトとベースに、応答すべき単語を次々予測するような仕組みらしい

どれがいい?

マルチモーダル

生成AIに対して様々な形式で情報を入力/出力することができるようになりました。オモシロイと思った例も載せておきます。

文字

ChatGPTを代表として文字ベースでやり取りをすることができますね

画像

生成AIに対して画像を読み込ませる、出力させる

qiita.com

試しにBardで画像をベースに質問を投げてみました。ウイスキーかワインかぱっと見ではわからないようなものでも、画像を読み込み判断することができました。すごい。

音声や音などのファイルを読み込ませる/出力させる

プロンプトエンジニアリング

  • ChatGPTのようにチャットができるAIではどのような質問を投げるかで、応答の品質が全然変わってきます
  • どのように質問を投げればよりよいかをこのブログではプロンプトエンジニアリングということにします

面白かった例

参考URL
ステップバイステップ
ステップバイステップでとお願いすると詳細に応答してくれる
ChatGPTを賢くする呪文 - 日本経済新聞 (nikkei.com)
深呼吸して
AIもじっくり考えたいんでしょうか
AIに「深呼吸しよう」といった人間っぽい言葉をかけると問題の正答率が上昇するという研究結果 - GIGAZINE
ゴールシークプロンプト
プロンプトエンジニアリングとはすこしちがうかもしれませんが、生成AIが曖昧な応答しかしてくれない場合、ゴール設定(AIに何をしてほしいのか)が曖昧なケースが多くあります。であれば、プロンプトもAIと質問形式で考えてみませんか。という考え方です
【ChatGPT】これだけ覚えればOK?ゴールシークプロンプトが誰でも使えて最強すぎた|Masaki KANAI (note.com)
  • この他にも色々あるようですが、みなさんもググってみてください
  • とにかく、具体的に、明確に、わかりやすく指示をしてやればいい感じの答えを出してくれることが多いと思います
  • 超絶親切な上司になったつもりでお願いしてみましょう

活用例

マルチモーダルなお陰でなんでもできる気がしています。生成AIのニュースを見たほうが早いかもしれません。

生成AI - Google 検索

Pixel8

  • もはや様々なところで活用されているとは思いますが、一番驚いたのはPixel8関連です
  • Pixel8では上記のようなAIがスマホのローカルで動くため、色々できるようです
  • 例えば、キーボードアプリのGboardが生成AIを使うことにより、校正したり返信する内容の候補を示してくれるようです
  • レコーダーで録音したデータを文字起こしして要約してくれるという新しい機能もこの生成AIがやってくれているのでしょうか

LINEBot

GPTが使えるようにLINEBotを作っています。グループラインにBotを入れておくと便利です。

Cursor

Cursor - The AI-first Code Editor

  • VSCodeでGPTを使えるようにした魔改造バージョン
  • コードの修正提案をしてもらったり、ドキュメントベースで質問したりとすごい

Edge

langchain

  • 生成AIを活用してなにかをするときに便利なライブラリです
  • 生成AIだけを使うならこのライブラリは不要ですが、なにかするときは便利です
    • 他のAPIと連携したい
    • Googleの検索結果と連携したい
    • 社内ドキュメントも検索してほしい

Photoshop

権利の話

難しいよね。。気になったリンクだけおいておきます

セキュリティ関連で気になったこと

  • ログ解析から、リポートのPPTを作ってくれるらしい。すごすぎる

xtech.nikkei.com

  • GoogleもSIEMやインテリジェンス領域にAIを使うっぽい。このモデルはセキュリティ特化とのこと。使ってみたい。。

japan.cnet.com

  • IAM関連は生成AIが強いかもしれない

enterprisezine.jp

scan.netsecurity.ne.jp

  • BurpSuiteの拡張として動作して、いろいろ教えてくれるそうです

github.com

最後に

毎日のようにニュースが更新されるので追いかけるのは大変ですが、わくわくするような技術ですね。もし学生の頃に生成AIの技術があればまっしぐらで勉強していたかもしれません。

まあ、仕事で使う際には社内ルールをしっかり確認しましょう。