コラム2 Gemini Embeddingで「特許の類似度」を測ってみた

「生成AI、とりあえず何かに使ってみたい!」

そんな探究心から、今回はGeminiの機能の一つである「Embedding(エンベディング)」を使って、特許文献の分析実験を行ってみました。

そもそも「Gemini Embedding」とは?

一言でいうと、「言葉や文章の”意味”に、住所(座標)を割り振る技術」のことです。

・キーワード検索: 「AI」と「人工知能」は文字が違うので、別のものとして扱われることがある。
・Embedding: 意味が同じなら、非常に「近い住所」を割り振る。

実験:請求項と先行文献の「距離」を測る

ある特許の「請求項」と、その審査過程の拒絶理由通知書で引用された「先行文献」との距離(意味の近さ)を測ってみました。

【解析データ】

・基準: ある特許の請求項
・比較対象: 主引例、副引例2、副引例3、副引例4

これらをGemini Embeddingで「ベクトル」という数値データに変換し、類似度を計算しました。

結果として、Geminiは「請求項と主引例」の類似度を、副引例との類似度よりも「高い」と示しました。

(※ただし、今回は1出願だけでの検証結果である点、ご了承お願いします。)

今後の活用可能性(アイデア段階)

この技術を応用すれば、例えば、先行技術調査で多数の文献がヒットしてしまった場合に、以下のような効率化が考えられるかもしれません。(※実際に検証はしていません)

1.全文献と出願内容との類似度スコアを算出する。
2.スコアが高い順から優先的に文献をチェックすることで、調査時間を短縮できる可能性があります。

ホームページに戻る