「テキストマイニング」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
(新しいページ: ''''【 てきすとまいにんぐ(text mining) 】''' 電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しよ...')
 
1行目: 1行目:
'''【 てきすとまいにんぐ(text mining) 】'''
+
'''【 てきすとまいにんぐ (text mining) 】'''
  
 
電子化された文書やWebページなどの膨大なテキストデータから,
 
電子化された文書やWebページなどの膨大なテキストデータから,

2007年9月19日 (水) 21:51時点における版

【 てきすとまいにんぐ (text mining) 】

電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.