NTTとNTTレゾナントは2011年2月21日、ポータルサイト「goo」内のQ&Aサービス「教えて!goo」の質問/回答データに対して、「カテゴリータグ」「主題タグ」「キーワードタグ」の3階層のタグを自動付与する「階層的オートタギング技術」の実証実験を開始した。文章に3種類の意味レベルのタグを付与することで、多様な観点で目的の文章を絞り込めるようにする。

 階層的オートタギング技術は、例えば「Q:最近彼氏との仲が上手くいっていません。ちょうど、彼氏の誕生日が近いのでメガネをあげようと思っているのですが、どんな物が喜ばれるでしょう?今は黒縁メガネのフレームが流行っているでしょうか」という質問文に対して、カテゴリータグとして「恋愛相談」と「ファッション」、主題タグとして「プレゼント」と「メガネ」、キーワードタグとして「誕生日」と「黒縁メガネ」と「フレーム」--といった3階層のタグを自動的に付与する。

 従来の自動タグ付けとは異なり、階層的オートタギング技術ではユーザーが各文章に付与したタグを学習データとしていない。教えて!gooに登録された約400のカテゴリーと約3万の主題語を参照し、各カテゴリーに多く登場する主題語を統計的に分析してカテゴリータグ、主題タグを決定する。

 さらに、「階層分類タギング機能」によって、文章に含まれていない文字列でも、文章内容から統計的に推定してカテゴリータグ/主題タグの組を付与する。例えば、上記の例文では、「彼氏」「仲」「誕生日」といった用語から、カテゴリータグ「恋愛相談」と主題タグ「プレゼント」の組を決定している。

 同技術は、「QA.ON/OFF」の名称でgoo内の実証実験サイト「gooラボ」に実装する。教えて!gooの質問・回答を検索する際に、同技術によって自動付与された3種類のタグをオン/オフすることで、検索内容を絞り込んでいくことができる。