『技術』に関する記事

Feature selectionのためのInformation GainとBi-normal Separation

こんにちは。胡です。
最近は、文章カテゴリ化課題におけるFeature selectionの問題についていろいろと調べてみました。

Feature extractionとFeature selection
文章のカテゴリ化という課題を解決するために、
ベクトル空間モデルが良く使われますが、
語彙数が多い場合は次元の呪いにかかってしまいます。
その時に、次元の削減が必要となります。
続きを読む...

表情認識アプリをつくってみた

こんにちは、馬場です。

最近弊社R&Dでは脳の活動情報をコミュニケーションに活かす研究がホットですが、他にも観測できる生体反応はあります。例えば、声や表情、心拍や身振り手振りなどです。これらの情報は近年安価な機器で比較的簡単に測定ができるようになってきており、Intel はカメラの情報から手や指、顔の動きを記録するSDK(Software Development Kit)を公開しています。
続きを読む...

【言語処理学会】Wikipediaを用いた語義曖昧性解消のための辞書の自動構築

こんにちは。胡です。
言語処理学会第20回年次大会@北海道に行ってまいりました。
今回、弊社はゴールドスポンサーとして登場しました!
それとは別に、本会議の初日に「Wikipediaを用いた語義曖昧性解消のための辞書の自動構築」というタイトルで、ポスター発表をしてきました。
本記事では、上述のポスター発表の内容についてご紹介いたします。
続きを読む...

前処理にPostgreSQLを使う:環境情報の切り出し

こんにちは。2014年の初投稿となりますが、あまり新年とは関係ありません。

データ分析とその前処理について、個人の環境を作るだけなら問題になりませんが、チームで共有したい場合に色々と考えることが出て来ます。一番面倒なのは、環境を共有する必要があるが、環境そのものを共用することはできない(会社が違う)、しかも全く同じ環境をコピーする訳にはいかないという状況です。
続きを読む...

切り抜きたい(再利用 Ver.)

東です。

切り抜きたい(再発明 Ver.)の続きです。

「手元にある大量の画像をマスク処理する」という要求に対して、OpenCVのライブラリを使ってC++で実装しましたが、画像処理のコマンドが多く用意されているImageMagickを使えばもっと簡単にできるんじゃないの?というお話です。

お題
素材画像(カラー)、マスク画像(グレースケール)を与えると、素材画像のうちマスク画像の黒色の部分が透過した画像を出力せよ。
続きを読む...