データマイニングで宝物を見つける

読者数 1,000人~ 発行頻度 1週間/回 パソコン

広告価格帯 ~50,000円/回(概算)

※メルマガ内容は省略されています。もっと詳しく見る

広告のお問い合わせ

  • メルマガ概要
  • バックナンバー一覧

冷えますねぇ

配信日:2009年12月11日

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

データマイニングで宝物を見つける! No.196

 〜 冷えますねぇ 〜

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■


皆さん、こんにちは! 米谷学です。
日にちを勘違いしており、昨日配信していなかったので、今日配信をします。(^^ゞ

いろいろな意味で更に有名になった日本漢字能力検定協会ですが、今日
(12月11日)「今年の漢字」として、「新」と発表されました。

まさか「薬」なんて出てこないだろう、と思っていましたが、「薬」は何と2位。
マンモスびっくりピー!(苦笑)

まぁ、2位になるのも納得できなくは無いですが、新たな気持ちで、また新たな風が
吹くように、という願いが込められるのであれば、「新」という字が選ばれたのは
良い話だろうと思いました。新語・流行語大賞に比べたら(謎)。

受賞の中に「トゥース」が入っていなかったんですねぇ。

わたくしの場合は、皆さんの夢の中に出てくるようなことはしませんので、
ご安心を。(By「トゥース」というセリフと共に有名になったお笑いコンビ
「オードリー」のネタより)

==========================================================================

さて、前号の続きです。
本などでデータ分析や予測のやり方を理解したつもりでも、実際はウマく活用
できない場合があるのか、ご相談を受けることがあります。

そして、前号では、こんな問題を出題しました。

【問題】

さて、次のケースでは、分析を行うのに適していない(意味が無い)データは
どれでしょうか??


【A】住所の北海道地区を「1」、東北地区を「2」…とした項目と、購入金額
   との2列のデータを基に、関連を求めた。

【B】同じ商品を販売している部署にいる営業社員10名について、販売個数・
   粗利益・販売価格のデータを基に、販売個数と粗利益のデータから、
   販売価格がいくらになるかを予測する。

【C】アンケートデータにおいて、データNo.1〜6に年代別データを、No.7〜10は
   職業別の切り口、No.11〜16を利用年数別の切り口で合計16行の表を用意した。

==========================================================================

「Excelでチャレンジ!データ活用」
PDF教材 ダウンロード販売価格: ¥3,000.-
アフィリエイター向けマージン: 30%
自己アフィリエイトOK!!

 → http://www.datamining.jp/goods/dmj002.htm

==========================================================================

◆好評開講中!オンラインで気軽に受講!◆

 データマイニングの基礎編
 → http://www.nikkei-nbsonline.com/course/kouza_xav50501.html
 
 データマイニングの活用編
 → http://www.nikkei-nbsonline.com/course/kouza_xav60501.html

 マーケティングに活かす予測スキル1 <数値予測・判別予測編>
 http://www.nikkei-nbsonline.com/course/kouza_xavm0501.html

 マーケティングに活かす予測スキル2 <時系列データ・最適予測編>
 http://www.nikkei-nbsonline.com/course/kouza_xavn0501.html

==========================================================================

では、3つについて考えていきましょう。


【A】住所の北海道地区を「1」、東北地区を「2」…とした項目と、購入金額
   との2列のデータを基に、関連を求めた。

これについては、北海道地区を「1」と、東北地区を「2」と割り振るのか、
北海道地区を「3」と、東北地区を「7」と割り振るのかによって、分析結果が
異なってきます。

地区と割り振られた数値との間には、数の大小に意味が無いためです。
これで購入金額との関連を探ろうとしても、分析ができないわけではありませんが、
その分析結果に意味は無いと言えるでしょう。

【B】同じ商品を販売している部署にいる営業社員10名について、販売個数・
   粗利益・販売価格のデータを基に、販売個数と粗利益のデータから、
   販売価格がいくらになるかを予測する。

「同じ商品を販売している」ということがこの文章のミソです。
販売価格が同じであれば、粗利益が同じです。
つまり、分析の際、「粗利益」と「販売個数」は数値の上では同じことを
言っていることになるので、これら2つの項目のどちらかは分析から取り除いて
良い場合があります。

【C】アンケートデータにおいて、データNo.1〜6に年代別データを、No.7〜10は
   職業別の切り口、No.11〜16を利用年数別の切り口で合計16行の表を用意した。

これは、全体のデータ、例えば1000人分のアンケートデータがある場合、1000人の
回答者層を、No.1〜6では性別に、No.7〜10は職業別に分けただけなので、
16行の分析をするのではなく、本来は1000人のデータを基に分析をするべきです。

1000人分の同じ内容について、分け方だけが違う3つ分のアンケートがあることに
なり、この分析は意味がありません。


著書やいろいろな講座を通じていただくご質問については、著書や講座で
採り上げている範囲内のことであれば、ハロー!データマイニングの
問い合わせフォーム、または講座で設置している問い合わせフォームより
ご質問を承ります。

また、これらの内容を踏まえて、あなたの会社でお持ちのデータを使って
分析をされた場合のご相談については有償にて承ります。
(@3万円より。都度見積り。)

 問い合わせフォーム:
 → https://secure17.chicappa.jp/kuron.jp-datamining/toiawase.htm

==========================================================================

  手洗いやうがいの励行を、わたくしからも呼びかけます。

==========================================================================

●●メルマガ広告掲載 受付中!!●●

  → http://www.datamining.jp/ma/h-mailma.htm
  この場所への掲載は、1回の掲載につき¥6,000.- で承ります。

==========================================================================

発行: 米谷 学
     ハロー!データマイニング(旧・上田データマイニング塾)
                   http://www.datamining.jp
     池田データメーション研究所 http://www.datamation.jp

お問合せ先:
 https://secure17.chicappa.jp/~kuron.jp-datamining/toiawase.htm

配信解除等: http://www.mag2.com/m/0000041942.html

==========================================================================

 記載の内容を転載等をされる場合は、出典を明記していただけると幸いです。













広告のお問い合わせ
メルマガ広告に関するご相談は無料です。お気軽にお問い合わせください。TEL:0120-109-744
ぺージ一番上へ