評判情報分析

研究

評判情報分析 (テキストマイニング)

オブジェクト指向型検索エンジン実現のための属性の自動抽出
IEEE/WIC/ACM Web Intelligence’15
ACM Symposium on Applied Computing (ACM SAC’16)
Researchers: 野村 慎太郎,中根 史敬

Attribute extractionWeb上には大量の構造化文書(HTML文書)が存在する.しかし,商品や人間,場所などのオブジェクトに関する情報を獲得するには,それらのオブジェクトに関する属性とその値を事前に獲得しておかなければならない.本研究では,ブートストラッピングアルゴリズムを適用することでWebページから自動で属性名を抽出する.ブートストラッピングアルゴリズムは,最新の自然言語処理技術の一つで,自然言語から値を抽出するためのテンプレートの学習と,学習したテンプレートを用いた値の抽出とを交互に繰り返すものである.このアルゴリズムにオブジェクトを一意に特定するキーの概念を導入することで,多くの属性名を精度よく獲得できることに成功した. [PDF]


レビューコメントからのネタバレ検出
IEEE/WIC/ACM Web Intelligence’14
IEEE/WIC/ACM Web Intelligence’16
Researchers: 前田 恭佑,岩井 秀成,池田 郁

iwai_res1s小説や映画のようにストーリーを伴う商品に対するレビューコメントには,時としてネタバレ(重要なストーリー展開に関する内容)が含まれることがある.我々は,そのようなストーリーの内容(あらすじ)に関する文を見ずに,レビューコメントを閲覧できるシステムを開発する.このシステムは,機械学習により文単位であらすじを含むか否かを推定する.また,推定精度を高めるために,人名の一般化とあるアイテム固有の単語の一般化を行う.最後に,ユーザが好みの不可視化のレベルを設定し,あらすじを含む文を隠すことができるインタフェースを開発する. [PDF]

数式の予測入力インタフェースの開発
Conference on Human-Computer Interaction (IFIP INTERACT’13)
Researchers: 堀江 圭介

horie_res1s

現在,PC上で数式を入植することはユーザに多大な労力をかけている.我々は,自然言語処理の分野の代表的な確率的言語モデルであるN-グラムモデルを用いて,ユーザが次に入力する数式の記号の予測を行う.数式は,たいてい階層構造により表現される.我々は,予測モデルの構築に数式の階層情報を導入する.これにより,高い精度で次に入力される記号を予測する.さらに,予測した記号を予測候補として提示する数式入力インタフェースを開発する.この研究はレビューコメントを直接に扱うものではないが,用いられる基本技術は評判情報分析で用いられるものと同じである. [PDF]

レビューコンテンツとレビュー履歴を用いたレビュアの信頼性評価
IEICE Transactions of Information and Systems, Vol.E95-D, No.11, 2012
Researchers: 田中 祐也,中村 伸子

tanaka_res1sオンラインショッピングサイトにおける顧客のレビューコメントは,買い物をしているユーザにとって参考になるものである.しかし,レビューの書き手(レビュア)には,信頼できる内容を書く者もいれば,知識や能力が足らず信頼に値しない内容しか書けない者もいる.この研究では,この分野で用いられている代表的な2種類の手法である,レビューのコンテンツの内容から信頼性を判定する方法とレビュアのレビュー履歴から信頼性を判定する方法の優劣を比較する.また,これらのハイブリッド手法を提案し,推定精度の向上を図る. [PDF]

アンカー関連テキストを用いたHITSアルゴリズムの改良
IEICE Trans. of Information and Systems, Vol.E89-D, No.6, 2006.
Web Intelligence and Agent Systems, Vol. 8, No. 2, 2010.
Researchers: Bui Quang Hung,大坪 正典

hung_res1sKleinbergのHITSアルゴリズムは,ページをランク付けする最もポピュラーなアルゴリズムである.このアルゴリズムの問題はトピックドリフトである.過去の研究者は,アンカー関連テキストによりこの問題を解決しようとしてきた.我々もアンカー関連テキストを用いるが,これまでの研究と異なり,ページの文書構造を解析して抽出したアンカー関連テキストを用いる.このテキストを用いることにより,どれだけHITSアルゴリズムの適合率が向上するかを確かめる.また,複数の種類のアンカー関連テキストの比較も行う.実験により,提案手法が過去の手法よりも高い適合性を達成することを示した. [PDF06] [PDF10]

ネットオークションのフィードバックコメントに対する社会的要約手法
ACM Conference on Intelligent User Interfaces (ACM IUI’06 Best Paper)
Researchers: 大野 華子,楠村 幸貴

ohno_res2sネットオークションの買い手は商品を買った相手(売り手)に対してフィードバックコメントを書く.この研究では,レビューコメントから儀礼的表現を検出し,それらを除外して要約を作成する方法を提案する.この検出のために,この研究では対象の売り手に対して書かれたフィードバックコメントだけでなく,各コメントの著者(買い手)が他の売り手に対して書いたフィードバックコメントも利用する.このようなネットオークション上の社会的関係を用いて,対象の売り手のフィードバックコメントを要約する.最後に,インタラクティブに要約結果を表示することができるインタフェースを開発する. [PDF]

NTM-Agent: ネットオークション上の商品紹介文からの特徴抽出エージェント
ACM Symposium on Applied Computing (ACM SAC’04)
Researchers: 楠村 幸貴

kusumura_res1s
この研究は,ネットオークション上の複数の商品の特徴を抽出し,一つの表で表示するエージェント(NTM-Agent)の開発を行う.これを実現するには,商品紹介文が自由なフォーマットで非定型な内容で書かれている問題がある.また,商品自体も,ネットオークションが提供するカテゴリに適切に分類されていない問題がある.二つ目の問題に対しては,NTM-Agentはキーワードの相関ルールにより不適切なアイテムをフィルタリングする.最初の問題に対しては,適応的にフォーマットのパターンを識別し,識別したフォーマットに応じたキーワード抽出を行う. [PDF]