- ホーム
- 広告募集中のメルマガ一覧
- ビジネス
- 詳細
データマイニングで宝物を見つける
※メルマガ内容は省略されています。もっと詳しく見る
冷えますねぇ
配信日:2009年12月11日
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
データマイニングで宝物を見つける! No.196
〜 冷えますねぇ 〜
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
皆さん、こんにちは! 米谷学です。
日にちを勘違いしており、昨日配信していなかったので、今日配信をします。(^^ゞ
いろいろな意味で更に有名になった日本漢字能力検定協会ですが、今日
(12月11日)「今年の漢字」として、「新」と発表されました。
まさか「薬」なんて出てこないだろう、と思っていましたが、「薬」は何と2位。
マンモスびっくりピー!(苦笑)
まぁ、2位になるのも納得できなくは無いですが、新たな気持ちで、また新たな風が
吹くように、という願いが込められるのであれば、「新」という字が選ばれたのは
良い話だろうと思いました。新語・流行語大賞に比べたら(謎)。
受賞の中に「トゥース」が入っていなかったんですねぇ。
わたくしの場合は、皆さんの夢の中に出てくるようなことはしませんので、
ご安心を。(By「トゥース」というセリフと共に有名になったお笑いコンビ
「オードリー」のネタより)
==========================================================================
さて、前号の続きです。
本などでデータ分析や予測のやり方を理解したつもりでも、実際はウマく活用
できない場合があるのか、ご相談を受けることがあります。
そして、前号では、こんな問題を出題しました。
【問題】
さて、次のケースでは、分析を行うのに適していない(意味が無い)データは
どれでしょうか??
【A】住所の北海道地区を「1」、東北地区を「2」…とした項目と、購入金額
との2列のデータを基に、関連を求めた。
【B】同じ商品を販売している部署にいる営業社員10名について、販売個数・
粗利益・販売価格のデータを基に、販売個数と粗利益のデータから、
販売価格がいくらになるかを予測する。
【C】アンケートデータにおいて、データNo.1〜6に年代別データを、No.7〜10は
職業別の切り口、No.11〜16を利用年数別の切り口で合計16行の表を用意した。
==========================================================================
「Excelでチャレンジ!データ活用」
PDF教材 ダウンロード販売価格: ¥3,000.-
アフィリエイター向けマージン: 30%
自己アフィリエイトOK!!
→ http://www.datamining.jp/goods/dmj002.htm
==========================================================================
◆好評開講中!オンラインで気軽に受講!◆
データマイニングの基礎編
→ http://www.nikkei-nbsonline.com/course/kouza_xav50501.html
データマイニングの活用編
→ http://www.nikkei-nbsonline.com/course/kouza_xav60501.html
マーケティングに活かす予測スキル1 <数値予測・判別予測編>
http://www.nikkei-nbsonline.com/course/kouza_xavm0501.html
マーケティングに活かす予測スキル2 <時系列データ・最適予測編>
http://www.nikkei-nbsonline.com/course/kouza_xavn0501.html
==========================================================================
では、3つについて考えていきましょう。
【A】住所の北海道地区を「1」、東北地区を「2」…とした項目と、購入金額
との2列のデータを基に、関連を求めた。
これについては、北海道地区を「1」と、東北地区を「2」と割り振るのか、
北海道地区を「3」と、東北地区を「7」と割り振るのかによって、分析結果が
異なってきます。
地区と割り振られた数値との間には、数の大小に意味が無いためです。
これで購入金額との関連を探ろうとしても、分析ができないわけではありませんが、
その分析結果に意味は無いと言えるでしょう。
【B】同じ商品を販売している部署にいる営業社員10名について、販売個数・
粗利益・販売価格のデータを基に、販売個数と粗利益のデータから、
販売価格がいくらになるかを予測する。
「同じ商品を販売している」ということがこの文章のミソです。
販売価格が同じであれば、粗利益が同じです。
つまり、分析の際、「粗利益」と「販売個数」は数値の上では同じことを
言っていることになるので、これら2つの項目のどちらかは分析から取り除いて
良い場合があります。
【C】アンケートデータにおいて、データNo.1〜6に年代別データを、No.7〜10は
職業別の切り口、No.11〜16を利用年数別の切り口で合計16行の表を用意した。
これは、全体のデータ、例えば1000人分のアンケートデータがある場合、1000人の
回答者層を、No.1〜6では性別に、No.7〜10は職業別に分けただけなので、
16行の分析をするのではなく、本来は1000人のデータを基に分析をするべきです。
1000人分の同じ内容について、分け方だけが違う3つ分のアンケートがあることに
なり、この分析は意味がありません。
著書やいろいろな講座を通じていただくご質問については、著書や講座で
採り上げている範囲内のことであれば、ハロー!データマイニングの
問い合わせフォーム、または講座で設置している問い合わせフォームより
ご質問を承ります。
また、これらの内容を踏まえて、あなたの会社でお持ちのデータを使って
分析をされた場合のご相談については有償にて承ります。
(@3万円より。都度見積り。)
問い合わせフォーム:
→ https://secure17.chicappa.jp/kuron.jp-datamining/toiawase.htm
==========================================================================
手洗いやうがいの励行を、わたくしからも呼びかけます。
==========================================================================
●●メルマガ広告掲載 受付中!!●●
→ http://www.datamining.jp/ma/h-mailma.htm
この場所への掲載は、1回の掲載につき¥6,000.- で承ります。
==========================================================================
発行: 米谷 学
ハロー!データマイニング(旧・上田データマイニング塾)
http://www.datamining.jp
池田データメーション研究所 http://www.datamation.jp
お問合せ先:
https://secure17.chicappa.jp/~kuron.jp-datamining/toiawase.htm
配信解除等: http://www.mag2.com/m/0000041942.html
==========================================================================
記載の内容を転載等をされる場合は、出典を明記していただけると幸いです。