高等学校新学習指導要領 数学科 情報科における...
TRANSCRIPT
1
高等学校新学習指導要領数学科 情報科におけるデータサイエンスの扱いについて
千葉県立千葉中学校 千葉高等学校 大橋 真也
Shinya Ohashi, Chiba prefectural Chiba Junior & Senior High School
1 はじめに
高等学校の新しい学習指導要領 [1] が,2018年3月に公示され,高等学校学習指導要領解説も2018年7月17日に公開された。本稿では,高等学校数学科及び情報科における
改訂のポイントについて説明するとともに,統計分野やデータサイエンスの扱い,データサイエンス教育についての今後の動向と課題について述べる。
2 新学習指導要領における改訂
高等学校学習指導要領が本年の3月に公開され,各教科の学習内容等を解説した高等
学校学習指導要領解説も本年の7月17日に文部科学省の Web サイトに公開された。高
等学校のこの新学習指導要領に準じた教育課程は,2022年より年次進行で実施予定で
ある。つまり,2022年以降の高等学校の新しい学習内容の基準が示されたと言うことである。
小,中学校に関しては,1年早い2017年に学習指導要領及びその解説が公開され,小
学校に関しては,2020年から,中学校に関しては2021年から全面実施される予定であ
る。小学校の改訂に関しては,東京オリンピックの開催の年に合わせての英語教育やプ
ログラミング教育の全員実施などで話題になっているが,初等中等教育にとっては,教育内容やその方法の大幅な変更が示されたといってよいだろう。
学習指導要領及び教育課程の改定スケジュールに関しては,図1の通りである。高等学校においては,2022年度より学年進行で実施予定であるが,本年または来年度
には,各学校において教育課程を検討し,編成しなければならない。また,2019年には教科書が作成され,2020年には教科書検定が行われる予定である。
さて,今回の改訂では,表面的には現行の課程からの変化が大きなものではないと考えられていたが,学習指導要領やその解説が公開され,その内容を読んでいくと,様々な変化や課題が見えてきている。その変化の一つが,統計分野やデータサイエンスの扱いである。社会の急速な変化とともにデータ活用の重要性が注目され,「機械学習」,「ビッグデータ」 , 「ディープラーニング」 などの言葉が世の中でも話題になっていることから,この変化は当然のことかもしれない。
学習指導要領及び学習指導要領解説 (数学編 理数編) [2] では,この変化に関して以下のように述べている。
1
2
* 噸 \underline{8}.継8 \underline{H}z\varepsilon-\cdot
図1: 今後の学習指導要領改訂スケジュール
(略)こうした変化の一つとして,進化した人工知能 (AI) が様々な判断を行った
り,身近な物の働きがインターネット経由で最適化されたりする IoT が広が
るなど,Society5.0とも呼ばれる新たな時代の到来が,社会や生活を大きく変えていくとの予測もなされている。また,情報化やグローバル化が進展する社会においては,多様な事象が複雑さを増し,変化の先行きを見通すこと
が一層難しくなってきている。そうした予測困難な時代を迎える中で,選挙
権年齢が引き下げられ,更に平成34(2022) 年度からは成年年齢が18歳へと引き下げられることに伴い,高校生にとって政治や社会は一層身近なものとなるとともに,自ら考え,積極的に国家や社会の形成に参画する環境が整いつつある。
(略) [学習指導要領解説数学現,改訂の趣旨より]
これにもあるように,内閣府の科学技術政策で提唱している 「Society5.0」 などもデータサイエンスやデータに関わる数学の必要性が述べられている。
今回この統計分野に関しては,数学科と情報科の双方に記載があることも特徴である。
また従来のデータ分析の内容に関しても変化があり,「理数探究」 の解説にも 「機械学習」という言葉が登場していることも特徴的である。
数学科と情報科の学習指導要領の内容に踏み込んで,より細かな内容について調べてみよう。
2.1 数学科の新学習指導要領
数学科に関しては,現行の数学I,II,III,A,B, 数学活用から,「数学活用」 がなくなり,数学 C が復活した。現行では,数学 B の単元であった 「ベクトル」 が数学 C に移動したことが大きな話題となった。大学入試の関係で,数学 B からは,「数列」 , 「ベクトル」 ,
2
3
図2: 内閣府 Society5.0のWeb サイトより
「確率分布と統計的な推測」 の3項目から2項目の選択で実施しており,多くの大学の
入試問題でもそのうち 「数列」 と「ベクトル」 が出題範囲であったために,「確率分布と
統計的な推測」 を実施する学校は少なかった。「ベクトル」 が数学 C に移動したために,
多くの学校では,新学習指導要領の数学 B を実施する場合,「数列」 と「統計的な推測1 」
を選択するように考えられており,この点でも統計分野を推進していることが見てとれるだろう。また現行の数学 Iで学習していた箱ひげ図や四分位数が中学2年での学習内容に変更になったことも大きな変更の一つだろう。さらに今回の数学の学習指導要領解
説は,例示が多く,具体的に何を扱うのかがわかりやすい構成となっていることにも注
意したい。
2.Ll 数学 I
箱ひげ図や四分位数が中学の学習内容に移動して,新たに学習内容として導入された
のは,「相関と因果の違い」 , 「仮説検証型アプローチ,仮説探索型アプローチ」 , 「質的
データと量的データの扱い」 , 「分割表」 , 「外れ値」 などである。「相関と因果の違い」 は,従来から相関係数などについて扱っていたものをさらにも
う一歩進め,具体的に因果とは何かについて理解できることを求めている。
「仮説検証型アプローチ」 に関しては,「問題場面に対する仮説を立て,データを収集しその仮説を検証していく活動」 としており,一方で 「仮説探索型アプローチ」 とは,
これまでは気づいていなかった問題を発見し仮説を形成する活動」 としている。いずれ
もこれらを通じて,仮説検定等の考え方やデータ分析について理解させていく活動を想定している。
「質的データ」 と「量的データ」 については,中学段階で扱われていたが,正確な扱い方やグラフ等による可視化の手法などとの関連づけがあまりなされないでいた。これ
1現行課程から単元名が変更になっている。
3
4
らを相互に関連させたデータに関しても扱う予定である。また 「分割表」 は,「質的データ」 どうしの関係を表すために導入されており,数学 B 等で \chi^{2} 検定などを扱える伏線となっているのかもしれない。
「外れ値」 に関しては,現行の課程における箱ひげ図でひげを最大値や最小値まで伸ばして表現していたものを改め,第1四分位数と第3四分位数とで作る箱の幅の1.5倍までのひげを伸ばし,それを外れるものを外れ値とする考え方であり,一般のデータ分析でも用いられている考え方に一歩近づいたと考えられる。
これらの変更は,情報科におけるデータサイエンスにも大きく関連している。
2.1.2 数学 A
数学 A でも統計分野に少しだけ変更が見られる。「主観確率」 や「ベイズ推定」 という
言葉が登場し,頻度論的な確率に加え,ベイズの確率についても導入される予定である。ベイズ推論は,機械学習などでも用いられている考え方の一つであり,情報科で扱う
学習内容と関連づけられることも考えられる。
2.1.3 数学 B
数学 B では,「仮説検定」 が久々に導入されるのが新しいことだろう。学習指導要領
には,身に付けるべき知識及び技能について,「正規分布を用いた区間推定及び仮説検定の方法を理解すること。」 とある。また解説の中には,「目的に応じて標本調査を設計し,
収集したデータを基にコンピュータなどの情報機器を用いて処理するなどして,母集団の特徴や傾向を推測し判断するとともに,標本調査の方法や結果を批判的に考察するこ
と」 とあることなどから,情報科のデータ分析との関連も想定されていることが理解できるだろう。
2.L4 数学 C
新設の 「数学 C」であるが,「数学 B」との履修の順序性は明記されていないので,2年次に実施することなども可能であろう。解説中には,隣接行列やグラフなども登場しており,行列とデータとの関連が意識されている。
2.2 情報科の新学習指導要領
情報科の学習指導要領に関しては,科目編成から大幅に見直し,変更された部分が多くある。2003年から始まった情報科であるが,当初は情報 A,B,C という3科目からの
選択必履修であったが,現行の課程では,「社会と情報」 , 「情報の科学」 という2科目からの選択必履修に変更になり,新学習指導要領では,「情報 I」が必履修科目,その発展
的な科目として 「情報Ⅱ」 が設定されている。
4
5
今回の高等学校学習指導要領解説 (情報編) [3] では,「機械学習」 という言葉とともに,統計ソフトウェアや数式処理ソフトウェアの活用についても記述されていることも興味
深い。
2.3 情報 I
情報 Iの学習内容は,現行の 「情報の科学」 を多少は引き継いでおり,「(1) 情報社会の問題解決」 , 「(2) コミュニケーションと情報デザイン」 , 「(3) コンピュータとプログラミング」 , 「(4) 情報通信ネットワークとデータの活用」 の4つの項目で編成されている。
世間では,「プログラミング」 が注目を集めているが,現行の課程でも 「情報の科学」でアルゴリズムが取り上げられている関係で,プログラミングが目新しいものにはなっていない。プログラミングも内容的にかなり変更が加わってはいるが,「情報デザイン」,「データの活用」 が大きな変更であると考えられるだろう。
情報科の科目に関しては,現行の科目の内容をほとんど継承せずに,新しい内容が多く取り込まれたと考えてもよいだろう。
(4) 情報通信ネットワークとデータの活用」 では,データの分析の部分として,身に付けるべき知識及び技術として以下のように書かれている。
データを表現,蓄積するための表し方と,データを収集,整理,分析する方法について理解し技能を身に付けることでは,データを問題の発見解決に
活用するために,ファイルとして蓄積するためのデータの様々な形式,データを収集,整理,分析する一連のデータ処理の流れ及びその評価について理解するようにする。その際,データの形式としては,関係データベースや表計算ソフトウェア等で扱われる表形式で表現されるデータをはじめとして,様々な形式のデータを扱う。
また,名義尺度,順序尺度,間隔尺度,比例尺度などのデータの尺度水準の違い,文字情報として得られる 「質的データ」 と数値情報として得られる「量的データ」 などの扱い方の違いを理解するようにする。
データの収集としては,データの内容や形式を踏まえて,その収集方法を理解するようにする。データの整理としては,データに含まれる欠損値や外れ
値の扱いやデータを整理,変換する必要性を理解するようにする。データの分析としては,基礎的な分析及び可視化の方法,多量のテキストから有用な情報を取り出すテキストマイニングの基礎やその方法を理解するようにする。
データの分析を行うための手順を実習を基に理解することや,数学でも学習する 「質的データ」 , 「量的データ」 の扱いをより詳しく学習する予定である。
またデータクリーニングやテキストマイニングなどについても触れることが明示され
ている。
また,身に付けるべき思考力 , 判断力 , 表現力等に関しては,以下のように書かれて
いる。
5
6
データの収集,整理,分析及び結果の表現の方法を適切に選択し,実行し,
評価し改善することでは,データを問題の発見解決に活用するために,必要なデータの収集について,選択,判断する力,それに応じて適切なデータの整理や変換の方法を判断する力,分析の目的に応じた方法を選択,処理す
る力,その結果について多面的な可視化を行うことにより,データに含まれる傾向を見いだす力を養う。
また,データの傾向に関して評価するために,客観的な指標を基に判断する力,生徒自身の考えを基にした適正な解釈を行う力を養う。
更に,地域や学校の実態及び生徒の状況に応じて,数学科と連携し,データを収集する前に,分析の構想を練り,紐付ける項目を洗い出したり,外れ値について適切に扱ったり,データの傾向について評価したりするために仮説検定の考え方などを取り扱うことも考えられる。
面白いのは,データの分析に関する 「解釈」 も重視することが書かれており,単なる客観的な結果のみで判断するだけではなく,その結果に対して思考力や判断力を育成す
ることが望まれている。
また,その内容をより詳細に読むと,単回帰分析や散布図行列などを想像させる記述
も多い。
2.4 情報 II
情報 II の学習内容は,「(1) 情報社会の進展と情報技術」 , 「(2) コミュニケーションとコンテンツ」 , 「(3) 情報とデータサイエンス」,「(4) 情報システムとプログラミング」 の4つの項目で構成されている。データサイエンスという言葉が,直接出てきているのも特徴的である。
「(3) 情報とデータサイエンス」 は,以下のような内容であることが,学習指導要領にも書かれている。
多様かつ大量のデータを活用することの有用性に着目し,データサイエン
スの手法によりデータを分析し,その結果を読み取り解釈する活動を通して,次の事項を身に付けることができるよう指導する。
ア次のような知識及び技能を身に付けること。
(ア) 多様かつ大量のデータの存在やデータ活用の有用性,データサイエンスが社会に果たす役割について理解し,目的に応じた適切なデータの収集や整理,整形について理解し技能を身に付けること。
(イ)データに基づく現象のモデル化やデータの処理を行い解釈表現する方法について理解し技能を身に付けること。
(ウ) データ処理の結果を基にモデルを評価することの意義とその方法について理解し技能を身に付けること。
イ次のような思考力 , 判断力 , 表現力等を身に付けること。
6
7
(ア) 目的に応じて,適切なデータを収集し,整理し,整形すること。(イ)将来の現象を予測したり,複数の現象問の関連を明らかにしたりする
ために,適切なモデル化や処理,解釈表現を行うこと。
(ウ) モデルやデータ処理の結果を評価し,モデル化や処理,解釈表現の方法を改善すること。
また,学習のねらいとして,以下のような記述もある。
ここでは,情報の科学的な見方考え方を働かせて , 問題を明確にし,分
析方針を立て,社会の様々なデータ,情報システムや情報通信ネットワーク
に接続された情報機器により生成されているデータについて,整理,整形,分析などを行う。また,その結果を考察する学習活動を通して,社会や身近
な生活の中でデータサイエンスに関する多様な知識や技術を用いて,人工知能による画像認識,翻訳など,機械学習を活用した様々な製品やサービスが開発されたり,新たな知見が生み出されたりしていることを理解するように
する。更に,不確実な事象を予測するなどの問題発見解決行うために,データの収集,整理,整形,モデル化,可視化,分析,評価,実行,効果検証な
どの各過程における方法を理解し,必要な技能を身に付け,データに基づいて科学的に考えることにより問題解決に取り組む力を養うことをねらいとし
ている。
当然ながら,ねらいは 「問題解決」 である。そのためにデータの様々な加工や見方などが示されている。また分析の手法に関しても,機械学習もはじめとして様々な手法が
提案されている。
また統計分野に関しては,重回帰分析が想定されている。機械学習等のデータサイエンスに関しては,分類,予測,クラスタリング等の基本について学ぶとしている。
3 カリキュラム マネジメントの必要性
今回の学習指導要領の改訂の中で,「主体的対話的で深い学び」 と言われるアクティブラーニングの他にも 「カリキュラム マネジメント」 という言葉がよく取り上げられ
ている。これは,単に各学年にどのような科目を配置するかということを意味している
のではなく,どのように科目を配置することによって,効果的に生徒の力を伸ばし,将来必要な知識や技術を身に付けさせることができるのか,教科問連携や,外部人材の活
用なども含めて,考えることを意味している。
統計分野やデータサイエンスの学習においては,このような 「カリキュラム マネジメント」 の考え方が必要になる。数学科はコンピュータやソフトウェアの活用になれて
いない,また大規模なデータを扱った経験もない,情報科では,コンピュータは扱うが,データサイエンスの背景にある仕組みである数学を説明できるわけではない。そのために教科間連携や外部人材の活用が必要になるのである。少なくとも学校内での教科間連
7
8
携を行わなければ,情報科の授業でデータサイエンスを学習させることは難しいのではないだろうか。
3.1 仮説検定の考え方
数学 Iに新たに登場する 「仮説検定の考え方」 であるが,米国のカリフォルニアポリ
テク大学の Jimmy Doi が日本の SSH(Super Science High School) 校向けの授業として作った教材 [4] が参考になる。
仮説検定をコンピュータのシミュレーションで理解して教材である。内容は,イエール大学のこどもたちの実験結果が,有意であるかどうかを検証するためにコイントスを
活用することを考えていくのだが,大量のシミュレーションを必要とした際に乱数を用
いたコンピュータシミュレーションで検証するというものである。 R のShiny を活用した教材であり,高校の数学科でも情報科でも活用できる教材であろう。
3.2 情報科教員のための研修会
今年の夏に文部科学省の委託受業の一つで,全国の情報科の先生にデータサイエンスの講義を行う機会を得た。「テキストマイニング」 と「可視化による問題発見」 の2つ
である。
テキストマイニングは,RMeCab を使って,青空文庫の新美南吉作 「手袋を買いに」と「ごんぎつね」 を比較し,タグクラウドを作成するという授業である。
可視化により問題解決は,Hadley Wickham の 「 R によるデータサイエンス」 を基にして,データを可視化することで,その奇妙な挙動からいくつもの問題を発見していくという授業である。
いずれも統計ソフトウェア R については初心者の先生方が受講者であったが,十分に楽しんでもらえたと感じている。
4 今後の動向と課題
数学科や情報科のデータサイエンスに関しては,ソフトウェアの問題やオープンデー
タの不足,参考になる教材の不足など様々な課題が挙げられている。来年から各県で情報科の教員向けの研修が始まる。現在,そのための研修資料作りも
急ピッチで進んでいる。
また,情報科の大学入試に関しての検討も進んでおり,「大学入試共通テスト」 で情報
Iの内容が出題される予定であるという。
各社の教科書なども徐々に来年には登場し,数学科,情報科ともに新しい内容につい
て研修や学習を行う機会が増えてくるに違いない。それとともにカリキュラム マネジ
メントについても真剣に取り組む必要がある。
また,大学における教員養成では,今後はプログラミングとデータサイエンスを学習させていく必要性に迫られることだろう。今後の動向に期待したい。
8
9
参考文献
[1] 文部科学省 : 高等学校学習指導要領,http://www.mext.go.jp/component/a‐menu/education/micro‐detail/
--ics\Gamma iles/afi eldf i le/2018/07/11/1384661_{-}6_{-}1_{-}2 . pdf, 2018.
[2] 文部科学省 : 高等学校学習指導要領解説 (数学編 理数編),http://www.mext.go.jp/component/a‐menu/education/micro‐detail/
--ics\Gamma iles/afi eldf i le/2018/07/13/1407085_{-}5 . pdf, 2018.
[3] 文部科学省 : 高等学校学習指導要領解説 (情報編),http://www.mext.go.jp/component/a‐menu/education/micro‐detail/
--ics\Gamma iles/afi eldf i le/2018/07/19/1407085_{-}16_{-}01 . pdf, 2018.
[4] Jimmy Doi, SSH 校 Lecture note, California Poly, 2018.
9