1. 課題

【注】分析ツールは自由です(例: Excel、R、Orange、SPSSなど)。 ただし、以下の問題は講義資料およびこれまでの課題を参考にすることで、ExcelとOrangeを使用して解決することが可能です。

【注】課題の下にある解答例はあくまでもイメージです。本課題そのものとは直接関係がありません。ただし、このような内容を入れて、さらにコメントを付け加える形で回答してください。

課題1. データの集計と可視化: coop1901.csvを利用して、以下の2つの分析を行ってください。

  1. 大分類名ごとの売上金額の合計を計算し、上位10の大分類を調べてください。 また、その結果を売上金額が大きい順(降順)に並べ、グラフで可視化してください。

    image.png

  2. 日別の売上金額の合計を計算し、その推移を可視化してください。また、可視化結果に基づいて、2019年1月の中で売上金額が最も多かった日と最も少なかった日を特定してください。

    image.png

課題2. クラスター分析: sake.xlsxを利用して、以下分析を行ってください。

このデータは2013年の2人以上世帯の都市別の酒類 (清酒、焼酎、ビール、ウィスキー、ワイン、発泡酒、他の酒) の1世帯あたり支出金額のデータです。

  1. 各酒類の支出金額データに基づいて、階層的クラスター分析で都市 (市場) のセグメンテーション分析をしてください(デンドログラムを描いてクラスターの数を決めてください)。

    image.png

  2. クラスターごとの各酒類の支出金額の平均を求めて、各クラスターの特徴を述べてください。また、クラスター分析の結果を踏まえ、マーケティング戦略について適切にコメントしてください。

    image.png

課題3. ロジスティクス回帰分析: churn.xlsxを利用して、以下分析を行ってください。

このデータは、あるサブスクリプションサービスに対する顧客の利用頻度、顧客満足度、契約年数、及び離反結果が含まれるデータです。

  1. サービスに対する顧客の利用頻度**UsageFrequecy** 、満足度**Satisfaction、および契約年数Tenure**が顧客の離反行動にどのような影響を及ぼすか調べてください。

    image.png

    image.png

  2. 上記の結果を基に、以下の1名顧客は離反するかの可能性を予測してください

    UsageFrequecy=7; Satisfaction=3, Tenure=2.5

    image.png

課題4. バスケット分析: RSC_receipt.xlsxを利用して、以下分析を行ってください。

このデータは、1000人の消費者のレシートデータから、20個の商品カテゴリ(青菜,根菜,牛肉,豚肉,鶏肉,牛乳,パスタ,パスタソース, インスタントカレー,お茶,炭酸飲料, インスタントコーヒー,チョコレート, スナック菓子,米菓,アイス,洗耐洗剤,台所洗剤,シャンプー,リンス)の購買状況を抜き出したデータです。

  1. 「多くの人が頻繁に一緒に購入し、片方を購入するともう一方も高い確率で購入される商品ペア」 を特定し、その結果(一部のペアでも可)を基に、マーケティング戦略やプロモーション施策について具体的な提案を考えてください。

    image.png

  2. 「購入者は少ないが、その人たちがほぼ必ずセットで購入する商品ペア」 を特定し、その結果(一部のペアでも可)を基に、マーケティング戦略やプロモーション施策について具体的な提案を考えてください。

    image.png

課題5. PCAと回帰分析: AirlineRating.xlsxを利用して、以下分析を行ってください。

このデータは、第15回の講義用例題データです。