NTTセキュリティ・ジャパンに所属する研究者らがChatGPTでフィッシングサイトを検出する手法を提案した研究報告論文「Detecting Phishing Sites Using ChatGPT」を発表しました。
この手法では、Webサイトから情報を収集するためにWebクローラーを使用し、その収集したデータを元にプロンプトを作成します。プロンプトはChatGPTに提示され、ChatGPTは与えられたWebサイトがフィッシングサイトかどうかを判断します。
WebクローリングとChatGPTの組み合わせにより、Webサイトの正当性や怪しさに関する情報に基づいた判断が可能になり、機械学習モデルを微調整することなく、さまざまなフィッシングサイトを検出できます。また、Webサイト全体やURLのコンテキストから、ソーシャルエンジニアリングの特定も可能です。
ChatGPTがフィッシングサイトを正しく検知した場合の例と、検知した際のChatGPTの回答例も示されていて、WebサイトがFacebookになりすましてユーザーを危険にさらそうとしていることや、そのサイトがFacebookと関連していることをChatGPTが正しく認識し、ドメイン名が正規のFacebookでないと判断しました。
さらに、ChatGPTはソーシャルエンジニアリングの存在も認識し、HTML内に疑わしいリンクが存在することを明らかにしました。
提案手法の性能評価のために、フィッシングサイトの検出に特化したデータセットを使用して実験を行い、GPT-4を用いた実験では、98.3%の精度と98.4%の再現率という成果を示しました。
さらに、GPT-3.5とGPT-4の比較分析では、GPT-4は、ドメイン名の怪しさの判定、Webサイトの内容からのソーシャルエンジニアリングの特定、複数の要素を考慮した包括的なフィッシング検知など、多くの部分においてGPT-3.5を上回り、GPT-4の能力が大きく向上していることが明らかになりました。
これらの知見は、自動化されたサイバーセキュリティ対策を強化し、ユーザーが直面するオンライン詐欺行為のリスクを軽減するために重要な意味を持つといえます。
コメント