めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

2010-07-03から1日間の記事一覧

MapReduce デザインパターン (3)

"word co-occurrence problem" (文書内の近くにペアで出現する単語の数をカウントする処理)の2つの基本パターンである "Pairs" と "Stripes" から、Stripes を見てみます。 ソースコード 今度は、1つのレコード(1行)の中に同時に含まれる単語のペアの…