CMS の画像データに関する Chat GPT API 活用
最近、AI技術がすごい勢いで進化していて、いろんな分野で作業が自動化され、効率よく進められるようになってきています。CMS(コンテンツ管理システム)でも、AIの活用がますます重要になってきそうです。特に、Chat GPT APIのような高性能な自然言語処理技術を取り入れれば、CMSの使いやすさや生産性がぐんとアップするかもしれません。
そこで、今回は画像データに注目して、Chat GPT APIを使うことでどんな便利な機能が得られるのかを探ってみたいと思います。例えば、画像のalt属性を自動で生成したり、キャプションを提案したり、さらには類似画像検索のサポートを受けたりすることで、コンテンツ管理がどれだけスムーズになるのかを具体的に見ていきます。
まずは簡単に Chat GPT に写真を添付して「どんな写真? 」と聞いた結果は
この写真には、ソファの上に座っているゴールデンレトリバーが写っています。犬はリラックスしている様子で、舌を少し出して横を向いています。背景には明るいリビングルームが見え、温かい雰囲気の部屋です。
という結果が返ってきました。データベースに登録するために、もう少し簡潔で要点を押さえた形式に変換してもらいました。
ソファの上に座ってリラックスしているゴールデンレトリバー。犬は横を向き、少し舌を出している。背景には明るいリビングルームが広がり、温かい雰囲気を感じさせる。
メディアとして登録
普通に使っていると、なかなか画像の情報をテキストで登録することは面倒なのでしませんが、今回の Chat GPT で生成したテキストを入れると以下のような感じになります。
最初に聞いた「どんな写真?」という情報については、メモに設定しています。
タグ
次に、「タグ付けするなら?」と聞いてみます。
ゴールデンレトリバー , 犬のいる生活 , リラックス , ソファ , かわいい犬 , インテリア , ペットライフ , 室内犬 , 愛 ,
という結果になりましたが「タグは名詞だけに」と再度指示し、
ゴールデンレトリバー , 犬 , ソファ , リビング , インテリア , ペット , 室内 , 愛犬
もう少し厳選してもらい、最終的には
ゴールデンレトリバー , ソファ , リビング , ペット
の 4つを採用することにしました。 さらにタグ付けの精度を上げるために、既に設定済みのメディアのタグ一覧を渡して、そのタグも考慮しつつ似たものは使っているものに寄せるような感じにした方がいいとも考えていますが、メディアタグの一覧表示用のモジュールが無いので今回は Chat GPT のつけたもので進めます。
代替テキスト( alt )
「img の alt属性 を生成して」と頼むと、
ゴールデンレトリバーがソファに座っている
となりました。アクセシビリティを考慮したウェブサイト運営を考えると alt属性 をしっかりつけるような事を考える必要がありますが、AI の活用によって自動化することができるようになるといいですね。
色に関する情報を追加
今は、そんな機能はありませんが上記のようなことができると、色のデータを自動取得して色データを登録したり検索できるようになったらどうだろうと考えてみました。
「写真で利用されている色を3つ教えて」で
- ゴールド(犬の毛色)
- グレー(ソファの色)
- オレンジ(背景の照明の温かい光)
「カラーコードにすると」
- ゴールド:#D4A373
- グレー(ソファ):#7D8285
- オレンジ(照明):#FFA559
このように写真の色のデータ化することができるようになります。 同じ色ということであれば検索も簡単ですが、似た色を検索するということになるので、少し複雑な検索になり ユークリッド距離 というものを使うそうです。
RGB色空間での2つの色 (R1, G1, B1) と (R2, G2, B2) の距離は次のように計算され、この距離が小さいほど色は似ているとされます。
こんな検索もできるようになるといいですね。
最後に
Chat GPT の API を利用してメディアデータのテキスト化も、難しくない時代がすぐそこまでやってきているようです。社内の実験的なプロジェクトとして、第一弾として「タイトル候補の提示・エントリーのタグ生成」を準備しました。次に「ユニットのテキストを処理」ができるようになりそうです。その次に画像解析をやってみたいですね。