目次
テキストマイニング とは
マイニング とは日本語で『発掘』という意味です。テキストから発掘するからテキストマイニング 、テキストの山から価値ある情報を掘り出すのがデータマイニング という手法です。 日本語を用いたテキストではまず、定型化されていない文章の集まりを自然言語解析の手法を使って単語やフレーズという単位に分割します。その上で単語やフレーズの出現頻度や相関関係を分析して、有用な情報を抽出することになります。 テキストマイニングではルールに従って分析することにより、単語間の関係や時系列の変化などを抽出していきます。形態素解析や複合解析、特徴度解析、ポジネガ判定など、マイニング のルールはさまざまあり、どれを適用するかによって異なる色々な要素が読み取れます。 こうして業務上の問題点を把握したり、製品の評価を調べたり、特に多い問い合わせやクレームを見出したり、さらにこれらが時系列にどう変遷しているかを調べたり、分析・解析することができるようになります。大量のデータを解析する場合は、まずテキストマイニングをして大まかな傾向を把握してから人の目による読み込みを始めると効率が上がります。テキストマイニングに便利なツール
大変複雑なテキストマイニングですが、現在では発掘を助けてくれる便利なテキストマイニングツールがあります。今回はその中から無料で使えるものをふたつご紹介いたします。KH Coder
日本人の方が作成したテキストマイニングツールです。多変量解析により、テキスト内に頻発する言葉のグループや、同じ言葉を含むテキストのグループからテキストが出現する特徴を解析できます。ソースコードが公開されているため、コードの読める方ならカスタマイズも可能です。AIテキストマイニング
テキストを解析しやすい形に整形する機能や2つの文章を比較して解析できる機能を備えた便利なテキストマイニング ツールです。楽天やAmazonレビューの解析などに役に立ちます。