『自然言語処理』に関する記事

scikit-learnのtf-idfについて

機械学習のツールとして、scikit-learnは非常に使いやすいPythonのパッケージとされています。
このパッケージには、例えば交差検定の評価を繰り返して、
分類器に良さそうなパラメータを「検索」してくれるGridSearchなど、
研究をスムーズに進行させるための便利な機能がたくさん搭載されています。

一方、言語処理におけるクラスタリングやクラス分類問題の手がかりとして、
文書にある単語がよく使われます。
続きを読む...

自由回答文の自動分類についての考察

こんにちは。胡です。
市場調査などにおいては自由回答が改めてホットになっているため、
今回は言語処理の技術を用いる自由回答の自動分類について説明させていただきます。
手法全体の詳しい説明は、文献[1]に記載していますので、
ここでは自由回答文を処理する時の注意点および私自身の心得を紹介いたします。

自由回答文のタイプ
文の構造の複雑さによって,自由回答文は以下の3つに分けられると考えられます.
単語列挙タイプ
Q:好きな果物を書いてください。
続きを読む...

TwitterからのSocietas推定: 言語的成分の面白さ

我々は、価値観に基づいた人のモデル化を行い、Societasというマーケティング担当者にとって新たなインサイトを提供できるモデルを構築いたしました。また、この新しい価値観モデルをさらに人の発言と結び付けることにより、人の心を「読む」方法を探索しております。そこで、Twitterから人の価値観を推定することを試み、Twitter-Societasモデルを提案いたしました。
続きを読む...

研究成果のクラウドサービスへの還元(iNSIGHTBOX編)

お久しぶりです。 増田です。 研究開発グループでは日々様々な研究を行っています。 消費者行動予測、ニューロマーケティング、SNS分析、UX、画像、音声、テキストマイニングなどなど。 そこで得られたノウハウを、幸せな情報社会の実現に向けた活動の一つとして、iNSIGHTBOX(インサイトボックス)の開発に活かしています。 今回は、今までLAB BLOGで語られることのなかったiNSIGHTBOXという製品と、それにまつわる研究開発についてご紹介したいと思います。
続きを読む...