モノづくりにおける問題解決のためのデータサイエンス入門コース ·...

6
予備コース 7.15() 基礎編 7.16(木)-17(金) 活用編 8.27(木)-28(金) 近年、注目を集めているビッグデータ。しか し、実際には多くの企業が投資に見合った成果 を引き出せずにいるのが実情です。 これは、ビッグデータに対する過度な期待に 加え、データサイエンティストと呼ばれる人材 育成のむずかしさ、手持ちの情報をうまく活用 できていないことなどが原因と考えられます。 当コースでは、モノづくりに携わる技術者向 けに、ビッグデータ解析に用いられるデータサ イエンスや機械学習を平易に解説いたします。 ビッグデータに対する動きは、今や経営やマ ーケティングの分野にとどまらず、大規模・高 次元データの増加にともない、工業の分野でも 見られるようになってきました。ぜひ当コース をご利用下さい。

Upload: others

Post on 30-Oct-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

予備コース 7.15(水)

基礎編 7.16(木)-17(金)

活用編 8.27(木)-28(金)

近年、注目を集めているビッグデータ。しか

し、実際には多くの企業が投資に見合った成果

を引き出せずにいるのが実情です。

これは、ビッグデータに対する過度な期待に

加え、データサイエンティストと呼ばれる人材

育成のむずかしさ、手持ちの情報をうまく活用

できていないことなどが原因と考えられます。

当コースでは、モノづくりに携わる技術者向

けに、ビッグデータ解析に用いられるデータサ

イエンスや機械学習を平易に解説いたします。

ビッグデータに対する動きは、今や経営やマ

ーケティングの分野にとどまらず、大規模・高

次元データの増加にともない、工業の分野でも

見られるようになってきました。ぜひ当コース

をご利用下さい。

Page 2: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

ものづくりの現場において、たとえば工程データなどをビッグデータに適した手法(データサイエンス)で解析する

ことにより、精度が格段に向上し、より真実に近い分析結果を得ることができます。これにより、慢性不良を撲滅し

たり、工程の状況から不良の予兆を高精度に検知したり、などが可能になります。また、データを抜き取るのではな

く、工程から自動的に収集すれば、解析の効率化にもつながります。

図 1. 異常検知の事例

散布図から異常を検出するケースにおいて、従来の SQC(統計的品質管理)手法(左図)では、マハラノビスの汎距離

を用いて散布図上に確率楕円を描き、95%信頼限界から逸脱するものを異常と見なしている。しかし、確率楕円の中

心と散布図の中心(最も色が濃い部分)がずれている様に見える。データサイエンス手法(スプライン空間密度分布)を

用いた右図では、確率楕円とは異なり、より精細な形での推定が可能となっている。

ビッグデータの特徴は、文字通りそのデータ量の大きさです。データ量が多いために可能になることもありますが、

逆にそのデータに従来の SQC 手法を適用すると、誤った結果を導き出してしまうこともあります。

品質管理において非常によく用いられる仮説検定では、検定統計量を左の数式で算出する。そ

の場合、サンプルサイズ が膨大(ビッグデータ)になるに伴い、 の値も非常に大きくなり、

高い検出力を持つようになる。そのため、母平均 と の差が微小であっても「有意差あり」

との解析結果が出てしまい、間違った仮説を採択する恐れが大きい。

図 2.有意差検定の例

モノづくりにおける問題解決のためのデータサイエンス入門コース

-製造業におけるビッグデータ解析概論-

450 500 550 600 650 700 750 800

25

02

60

27

02

80

29

03

00

diameter

str

oke

5e-05

1e-04

0.00015 2e-04

0.00025

3e-04

0.0

0035

4e-0

4

n

V

-xt

00 =

μ|t| 0

0μμn

Page 3: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

SQC 手法とデータサイエンスは同じ統計手法の仲間ではありますが、それらはその考え方、アプローチ方法が異なっ

ており、データサイエンスはより大きなデータを扱うのに適した手法です。

図 3.SQC手法とデータサイエンスの違い

SQC 手法とデータサイエンスは、どちらが優れているというのではなく、お互いに得意分野が異なっている、と考え

てください。たとえば工程で大量のデータを収集する場合(製品の全数検査など)と、開発で限られたデータを用い

る場合(実験計画法を用いた試作など)では、それぞれに適した手法を用いるのが望ましい選択です。

ビッグデータのような大量データを扱う技術を身に着けるには、どうしてもデータサイエンスと呼ばれるベイズ統計

学などの知識・技術が必要になります。しかし、その必要性が叫ばれてはいるものの、一般に見られるビッグデータ

研修ではあまり扱われておらず、その教育についてはなかなか進んでいないのが実情です。その難解さから、社内教

育にも不向きと言われています。そのため、データサイエンティストを育成するには、限られた機会を逃さずに教育

を進める必要があります。

モノづくりにおける問題解決のためのデータサイエンス入門コース

-製造業におけるビッグデータ解析概論-

古典統計学

ベイズ統計学SVMなど

イベントドリブン

データドリブン

限られたデータから全体を把握する

大量のデータから全体を把握する

データサイエンスの知識を習得したいと思えば、専門書が多数出版されていますので、社内で勉強会などを開

催して勉強すれば、ある程度は理解できます。

しかし、専門書の内容は非常に高度で、初学者にはハードルが高いですし、いざ、実データを解析しようとし

ても、果たして結果が合っているのかどうか確かめようもなく、技術者が使いこなすまでには至りません。

講義では、罰則付き回帰 lassoなど、新手法をしっかり理解して頂くため、平易な解説に努めます。

さらには実例を使った演習を通じて、結果を得るまでのプロセスを体験し、実務で使いこなせるようになって

もらいます。

Page 4: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

「モノづくりにおける問題解決のためのデータサイエンス講演会」

が、2014 年 12 月 8 日(月)に日本科学技術連盟・千駄ヶ谷ビル(東京)

にて開催されました。会場には製造業におけるビッグデータ解析に

関心をもつ 70 名ほどの聴講者がご参加されました。

講演会では、ビッグデータの概念や解析する上での留意点につい

ての説明、製造業におけるビッグデータの事例とその解析事例の紹

介、「モノづくりにおける問題解決のためのデータサイエンス入門コ

ース」立ち上げの意義とその特徴についての紹介がなされました。

以下に、講演会の参加者からのアンケート結果をご紹介いたします。

●「モノづくりにおける問題解決のためのデータサイエンス入門コース」についてお聞かせください。

●お気づきの点がございましたらご記ください。

○データサイエンス、ビッグデータについて理解が深まりました。(輸送用機器、生産技術)

○SQC手法を再度学習する必要があると感じました。(輸送用機器、企画・調査・開発)

○データサイエンス入門コースはぜひ受講してみたいです。最適解は一つではないと感じます。

(金属製品、生産技術)

○「ビッグデータを活用したい」や「不良を減らしたい」といった目的を、もう数段階ブレークダウンして、目的

をもっと明確にする必要があると感じました。研修も受講してみたい。 (輸送用機器、生産技術)

モノづくりにおける問題解決のためのデータサイエンス入門コース

-製造業におけるビッグデータ解析概論-

さらに詳しい説明を

聞きたい。また、上

司や派遣責任者に説明をして欲しい。

2%

ぜひ、受講[派

遣]したい

22%

社内で受講

[派遣]を検討

したい

46%

受講[派遣]し

たくない

13%

無回答

17%

講演会の風景

Page 5: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

■講 師 氏(㈱デンソー 品質管理部 TQM推進室 担当次長、博士(工学))

当コースでは、上記内容を入門者向けに平易に解説します!

日 時 講義内容

予備コース 7月 15日(水) 9:30~18:00

大学教養程度の行列の知識/多変量解析(重回帰分析、主成分分析等)の概論

統計は XTXの逆行列が基本であり、それが正則であることが前提であることを学習する。

7月 16日(木)

9:30~12:30

今、なぜモノづくり企業でデータサイエンスが必要なのか ・なぜ仮説検定をやらないのか(ビッグデータの性質)

・製造業におけるデータサイエンスの活用(事例を通じて)

・「データドリブン」とは、データドリブンな問題解決の進め方(情報量規準,クロスバリデーション)

7月 16日(木)

13:30~18:00

ビッグデータ解析前の処理 ・R操作法 ・データクリーニングの必要性とその手法

・データ間の関連性と層別・可視化(混合ガウス分布) ・演習(データ分離と分離原因(多項ロジット回帰))

7月 17日(金)

9:30~12:30

ビッグデータを用いた異常の検知①(密度分布)

・データの密度分布・可視化 ・演習(工程データの異常検知)

7月 17日(金)

13:30~18:00

ビッグデータを用いた異常の検知②(識別モデル・生成モデルと分類器) ・識別モデルアプローチとは(判別分析と線形識別器(重回帰分析)は同じ)

・演習(種々の分類器による分類,k-NN,アダブースト,ロジット回帰,NN,SVM,ランダムフォレスト)

・生成モデルアプローチとは(ナイーブ・ベイズ) ・演習(OpenBUGSを使った母確率密度の推定 3題) さらに詳しく学ぶには/宿題の説明(識別問題,クエリの判定)

8月 27日(木)

9:30~12:30

宿題解説

ビッグデータを用いた要因解析①(グラフィカル・モデリング,glasso)

・因子間の関係・可視化 ・演習(糖尿病データの可視化)

8月 27日(木)

13:30~18:00

ビッグデータを用いた要因解析②(罰則付き回帰 lassoの徹底理解)

・罰則付き回帰(正則化回帰)(塗着率を交互作用も加えて解析する) ・演習(mtcarsの罰則付き回帰)

8月 28日(金)

9:30~18:00

総合演習―ビッグデータを用いたグループ演習―

・復習する手法:外れ値除去,混合ガウス分布による層別,グラフィカル・モデリング,lasso

さらに詳しく学ぶには/総合質疑

で第 43年度 日本品質管理学会 品質技術賞 を受賞!

〔受賞選考理由〕

本文献では、デンソーグループで実施されている従来のSQC統計的品質管理における業務プロ

セス評価項目の課題を明確にし、その課題を克服する方法が提案されている。

具体的には、ビッグデータ時代(データドリブン型アプローチ)となった時代に、今までのSQC統

計的品質管理における経験による推定(イベントドリブン型アプローチ)の危険性を説明し、今まで

の考え方だけでは、大きな間違いが起こることを示し、ビッグデータによる品質革新活用の社内教

育に取り組む具体的な方法が提案されている。

本文献は、産業界に役立つ業務的な研究で、「品質管理の実践と発展」という品質技術賞の選

考基準に照らし、同賞の受賞にふさわしいものと判断できる。

今後、提案内容の浸透度、汎用性が高まることを期待したい。

モノづくりにおける問題解決のためのデータサイエンス入門コース

-製造業におけるビッグデータ解析概論-

Page 6: モノづくりにおける問題解決のためのデータサイエンス入門コース · モノづくりにおける問題解決のためのデータサイエンス入門コース

日本科学技術連盟 東高円寺ビル (東京都杉並区高円寺南 1-2-1)

□申込方法 下記参加申込書に必要事項をご記入のうえ、FAXまたは E-mailでお送りください。

一般財団法人 日本科学技術連盟 セミナー受付グループ 宛

Tel 03-5990-5849 Fax:03-3344-3022 E-mail [email protected]

※ホームページからもお申込み頂けます! → http://www.juse.or.jp/

□お問い合わせ先 本コースの内容については、教育推進部第一課にお問い合わせください。

Tel 03-5378-1214 Fax 03-5378-9842 E-mail [email protected]

※本パンフレットの PDFデータを希望される場合は、上記お問合せ先までご連絡ください.

□従来型の問題解決法(SQC等)にプラスして、ビッグデータ解析に基づく問題解決法が習得できます。

□1人 1台パソコンを配付のうえ、フリーソフト「R」を用いたビッグデータ解析演習を多数行います。

□ビッグデータの解析により、従来のSQC手法では解決できなかった慢性不良が撲滅できるようになります。

□4日間のうち、<基礎編>のみの受講も可能です(<活用編>のみのご参加はできません)。

□最終日には、ビジネスとビッグデータ解析をつなげるトレーニングとして、総合演習(グループ演習)を行います。

□前提知識が不安な方でもご参加いただけるように、本コース受講前に「予備コース」をご用意しておりますので、ぜひご

利用ください。※予備コースのみの参加はできません。

□モノづくりに携わる実務者で、ビッグデータを業務に活用したい方

□製造業に携わる技術者で、自社のビッグデータの活用方法にお悩みの方

□データサイエンティストを目指している方で、解析スキルを身に付けたい方

□前提知識として、大学教養程度の行列の知識、多変量解析(重回帰分析、主成分分析等)の概論的知識をお持ちの方

FAX 03-3344-3022

「モノづくりにおける問題解決のためのデータサイエンス入門コース 参加申込書

◆ 参 加 者 月 日申込

記入不要 参加者名(ふりがな) 所属事業所・部課名 参加コース(□に✓を入れてください)

□【基礎編・活用編】 □【基礎編】 □【予備コース+基礎編】 □【予備コース+基礎編・活用編】

□【基礎編・活用編】 □【基礎編】 □【予備コース+基礎編】 □【予備コース+基礎編・活用編】

□【基礎編・活用編】 □【基礎編】 □【予備コース+基礎編】 □【予備コース+基礎編・活用編】

◆ 連絡担当者(お申込受付後「開催ご通知」をお送りする方)

会社名 事業所

TEL

部署・役職

担当者名

FAX

所在地 〒

参加費

【基礎編・活用編】 □130,680円(一般)× 名 = 円

□118,800円(会員)× 名 = 円

会員番号

【基礎編】 □ 72,360円(一般)× 名 = 円

□ 64,800円(会員)× 名 = 円

【予備コース+ 基礎編】

□ 96,120円(一般)× 名 = 円

□ 86,400円(会員)× 名 = 円

【予備コース+ 基礎編・活用編】

□154,440円(一般)× 名 = 円

□140,400円(会員)× 名 = 円

※ご記入下さいました企業・組織および個人情報は、参加申込受付処理ならびに日科技連からのセミナー情報ご送付のために使用いたします。 ※【キャンセルの取扱とお願い】コースにお申込み後,ご本人の都合が悪くなった場合には、原則として代理の方のご参加をお願いします.また, 止むを得ない事由により,お客様の都合でキャンセルされる場合には,セミナー受付担当まで FAXまたはメールにて事前にご連絡をお願いします. その際,ご連絡の日にちにより,次のキャンセル料をご負担いただきます. 【キャンセル料】・セミナー開催日の7営業日前~2営業日前のキャンセル-参加費の20%、・セミナー開催日の1営業日前17:00までの

キャンセル-参加費の50%、・1営業日前17:00以降または事前のご連絡がなかった場合-参加費の100%