Yanonoblog!

こつこつと

ChatGPTのLink Readerを使って外部サイトの情報を解析する

はじめに

開発者として色々なツールを日々活用していますが、あらゆる業務を効率化するために、ChatGPTを中心としたツールの活用方法を日常的に押さえておきたいと考えています。

本記事は、ChatGPTのプラグインであるLink Readerを使ってサイトやPDFを解析するという内容になります。

端的に解説するとWEBページ、PDF、PowerPoint、Word、画像ファイル、YouTubeなどのリンク先から情報を抽出し、内容の要約や解説を行う機能を提供するツールです。

仕組み

ChatGPTに聞いた感じ下記の認識になります。

コンテンツ取得

Link Readerは、指定されたURLからコンテンツを取得します。

これにはウェブページ、PDF、PPT、Word、ExcelGoogleドキュメント、GoogleスプレッドシートYouTubeリンクなどが含まれます。

以下のようにリクエストを作成します。

linkReader.getContent({
  url: "URLが入力される"
})
Google検索

Link ReaderはGoogleで検索を行い、結果をJSONデータとして取得します。

検索クエリ、検索地域、検索言語、検索タイプ、結果のオフセット(ページネーション用)、返す結果の最大数などを指定できます。

以下のようにリクエストを作成します。

linkReader.apiSearch({
  q: "検索クエリ",
  gl: "検索地域(例:us)",
  hl: "検索言語(例:en)",
  tbm: "検索タイプ(例:isch)",
  start: "結果のオフセット",
  num: "返す結果の最大数"
})

導入

下記の手順で行います。

  1. GPT-4をクリック
  2. Pluginsを選択
  3. プルダウンからStoreを開く
  4. Link Readerを追加 image

使い方

例えば下記のURLにアクセスして要約をお願いしたりすることができるようになります。

https://www.pref.kyoto.jp/kenkoshishin/documents/125.pdf

image

また、PDFなどはファイルデータを読み込みすることはできず、あくまでURLからのみ解析が出来る様になっております。

Youtubeのリンクを解析する

下記のように情報を抜き出すこともできるようです。

https://www.youtube.com/watch?v=4xAfYBt4314&pp=ygUHY2hhdGdwdA%3D%3D

image

音声を認識できるわけではない

直接ChatGPTに聞いたところ音声を認識しているのではなく、youtubeのサイト上で文字起こしされたデータを認識しているようです。

  • はい、その通りです。私の能力は、YouTubeの動画の音声を直接認識するのではなく、YouTubeが提供する自動生成された字幕やユーザーがアップロードした字幕を読み取ることに基づいています。これにより、動画の内容を理解し、それに関する質問に答えることができます。

とはいえ非常に強力な機能ですね。

おしまい

本記事の内容は以上になります!

今回の内容だけでなく活用できればいろんな活用方法がありそうです。

他にもまとめていきたいと思います。