大规模开放在线实训平台 -...

Click here to load reader

Post on 18-Jul-2020

17 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • 大规模开放在线实训平台 (Massive Open Online Workbench, MOOBench)

    王 伟(同济大学)

  • Outline

    • 大规模在线实训平台(MOOBench)

    • MOOBench在《数据科学通识导论》课程中的实践

    • MOOBench在《大数据原理与实践》课程中的实践

    • 思考与总结

  • 教育的“昨天”和“今天”

  • MOOC星火燎原 • 北美

    • Coursera、edX、Udacity • The Minerva Project、2U

    • 欧洲、澳洲 • Open University、Future Learn(英国) • Iversity(德国)、FUN(法国) • OpenUpEd(欧盟) • Open2study(澳大利亚)

    • 亚洲 • JMOOC(日本) • 中国:网易公开课、新浪公开课、淘宝同学、百度教育、腾讯教育频道、学堂在线、……

  • MOOC存在的问题 • 信息过载和信息碎片

    • 用户难以坚持下来,缺乏有效的动力

    • 缺乏交互性 • 交互式、协作工具的缺乏 • 缺乏师生交互、评价和反馈

    • 缺乏有效的实训平台(理工类课程) • 云计算、大数据、人工智能、物联网 • 新工科背景

  • 新时代的到来

    教育部公布第二批”数据科学与大数据技术专业”获批高校名单

  • 国家政策与导向 • 国务院印发《关于进一步扩大和升级信息消费持续释放内需潜力的指导意见》(国发〔2017〕40号)

    • 国务院印发《新一代人工智能发展规划》 • 重点一:中小学阶段设置人工智能课程 • 重点二:人才培养,建设人工智能学科 • 重点三:人工智能高端人才队伍建设 • 重点四:建立重大科技创新基地 • 重点五:智能教育

  • 教育信息化 习近平: “当今世界,科技进步日新月异,互联网、云计算、大数据

    等现代信息技术深刻改变着人类的思维、生产、生活、学习

    方式,深刻展示了世界发展的前景。” “因应信息技术的发展,推动教育变革和创新,构建网络化、

    数字化、个性化、终身化的教育体系,建设“人人皆学、处

    处能学、时时可学”的学习型社会,培养大批创新人才,是

    人类共同面临的重大课题。”

  • MOOBench: Massive Open Online Workbench • MOOBench(慕班)是大规模开放在线实训平台的缩写,是MOOC平台的延续与补充,主要是针对理工类课程提供大规模的、开放的、在线的实训环境。

  • MOOBench的驱动力 • 大数据与人工智能时代的教育诉求 • 传统慕课平台的缺失 • 新工科背景下的驱动 • 教育信息化的变革和创新 • 技术的进步:云、边、网、端

  • 云计算:Evolution of cloud computing

    Serverless

  • 大数据上云:Evolution of big data technology

    大数据软件栈

    数据上云! 分析上云! 大数据PaaS!

    2017

    Kaggle被收购 Cloudera IPO 星环科技TDH社区版 华为大数据认证

  • 人工智能上云:AI Stack Evolution

    • Amazon AI • Google AI • Ali AI • Baidu AI • …

    Amazon’s AI stack

    AI上云 AIaaS

    Google cloud TPU NVIDA GPU ARM Mobile AI

  • 新的交互技术

    Notebook/ Zeppelin Midas Rapid Miner IDE

    Interactive learning environment

  • MOOBench的特点 • Learning at Scale(大规模教育,MOOC的延续) • Learning by doing(实践、新工科的诉求) • 开放教育资源(Open) • 独享、快速、高效、灵活的实训环境(教育信息化创新)

    • 触手可及、 随时可用、 秒级启动、 用完即走

    • Intelligent Interactive online learning(智能化的交互学习) • 采集学员的学习行为数据 • 基于AI的实时评判与反馈 • 评论分析与挖掘(社群评论)

    • 师生交互 机生交互(AI)

  • 应用场景:新一代大数据工程实训平台

    基于云件服务的新一代大数据工程实训平台, 计算机教育, 2018.

  • 同济大学数据科学与大数据实训平台

  • 平台功能 • 教师端功能:定制课程实验内容、实验管理、学生管理、成绩管理、报告管理等。

    • 学生端功能:查看实验内容、阅读实验指导书、算法演示、改进算法、算法对比分析、提交算法、提交报告、查看成绩、修改个人信息等。

    • 平台管理功能:资源监控、查看计算作业、容器管理、日志管理、故障恢复等。

    • 开发环境:提供各种开发环境,如SQL、R、Python、Matlab等;提供Hadoop、Spark、Hbase、Hive等分布式实践环境。

    • 算法库:提供常用及经典算法,及基于R/Python/Matlab/SQL等实现的源代码。 • 综合项目案例库:提供多个行业的开放数据资源,以及相应的数据科学与大数据综合实验案例。

    • 开放数据资源库:提供各类数据资源库,包括真实数据以及模拟产生数据。

  • 同济大学导论类课程建设与教学实践

  • 《数据科学通识导论》课程总览

  • 数据科学通识教育16个字实践

    • 建立对话;激发思辨; • 协作交流;动手实践。

  • 1. 建立对话、激发思辨

    课件 文章 互动

  • 对话与思辨 • 你所理解的“通识课”是什么 ?你认为应该如何学习“数据科学”这门课程? • 从人类整个文明的尺度上看,IT和DT对人类的发展有些什么样的影响和冲击? • 怎么理解科学的范式?他们之间的关系如何?今天如何利用这些科学范式? • 谈谈你对数据分析思维的理解?大数据技术在整个数据科学中处于什么地位? • 如何理解数字化和数据化的区别与联系?Google图书扫描项目的利与弊。 • 摩尔定律与大数据的关系?在云计算环境中处理大数据会成为主流吗? • SQL语言到底是一种什么样的语言?在大数据时代的地位如何? • 大数据系统为什么要采用分布式的架构?为什么一些大数据系统要走开源的路线? • 统计学、概率论和数据分析三个概念之间的区别与联系是什么? • 你觉得在线使用数据分析工具会是趋势吗?机器学习能够带来真正的人工智能吗? • 智能时代,究竟是算法重要还是数据重要?怎么看待“算法自动推测犯罪”的技术? • 理想中的大数据和数据科学编程语言是什么样的?需要发明新的“人数”交互语言吗? • 为什么要数据开放?智慧城市的“智慧”体现在什么地方? • 数据科学在人工智能技术中的地位是什么? • 随着人工智能技术的发展,人类和智能机器之间会是一个什么样的关系?

  • 2. 协作交流、动手实践

    • 大数据基础实验(4个子模块,13个实验) • Hadoop基础实验 • MapReduce基础实验 • HBase基础实验 • Hive基础实验

    • 大数据挖掘实验(2个子模块,12个实验) • R大数据挖掘实验 • Python大数据挖掘实验

    • 案例分析实验(3个子模块,18个实验) • 案例一:泰坦尼克乘客生存预测 • 案例二:优秀员工离职原因分析与预测 • 案例三:用声音预测性别

    构建实训平台:5个实验模块,17个子模块,113个实验 • 基础语言学习实验(4个子模块,42个实验)

    • R语言编程基础实验 • R语言统计建模与分析基础实验 • Python语言编程基础实验 • Python语言统计建模与分析基础实验

    • 数据分析与挖掘实验(4个子模块,28个实验) • R数据探索与预处理实验 • R数据挖掘实验 • Python数据探索与预处理实验 • Python数据分析实验

  • 实训平台即服务(作为一种基础设施)

    实验教程

    实验区域

    隐藏 启动 暂停 截图 共享 下载 全屏

  • 演 示

  • 作业管理与课程管理

  • 《大数据原理与实践》课程总览

    2017 Google支持教育部产学合作协同育人项目

  • 容融入Google的的大数据技术、工具和平台 • 第二章,增加Google在大数据方面的影响和实践,以及Google数据中心的介绍;

    • 第三章,增加对Google大数据技术的总体介绍和贡献;

    • 第四章,增加对Google大数据应用的介绍,如Google图书、Google Earth、Gmail等;

    • 第五章,增加Google网页获取技术的原理介绍,详细介绍网页爬虫的原理;

    • 第六章,增加Google的GFS技术原理介绍,以及和HDFS的关系;

    • 第七章,增加Google的BigTable技术原理,以及和传统数据库管理技术的区别;

    • 第八章,增加Google的MapReduce技术原理及其背后的大数据处理思想;

    • 第九章,增加Google最新的相关技术,包括Pregel、Caffeine、Dremel、Spanner等;

    • 第十章,增加Google的网页挖掘技术,详细介绍PageRank算法;

    • 第十一章,增加Google的TPU和TensorFlow内容的介绍;

    • 第十二章,增加Google的Blockly语言、Google Web Designer等技术介绍;

    • 第十三章,增加Google的Kaggle平台介绍,详细介绍数据分析项目的流程步骤;

    • 第十四章,增加Google的Python Fire介绍,鼓励学生用Python等语言进行大数据实践。

  • 近期的重点工作

    • TensorFlow实验课程的建设 • Jupyter Lab的集成 • 基于SQL的大数据实验模块 • 学员在线行为数据的采集 • 更多综合案例的开发

  • 思考与总结 • 大规模开放在线实训平台(MOOBench)将成为大数据、人工智能、新工科背景下的又一个教育信息化场景;

    • “人工智能 + 教育大数据”将会在接下来的在线教育中发挥更加实质性的影响;

    • 数据科学与大数据的相关核心技术将会陆续成熟稳定,其知识体系也将慢慢沉淀下来;

    • 通识类课程的改革,真正做到以学生为本。

  • Thanks

    Education is not preparation for life; education is the life itself. — John Dewey

    课程公众号 个人微信

    大规模开放在线实训平台Outline教育的“昨天”和“今天”MOOC星火燎原MOOC存在的问题新时代的到来国家政策与导向教育信息化MOOBench: Massive Open Online WorkbenchMOOBench的驱动力云计算:Evolution of cloud computing大数据上云:Evolution of big data technology人工智能上云:AI Stack Evolution新的交互技术MOOBench的特点应用场景:新一代大数据工程实训平台同济大学数据科学与大数据实训平台平台功能同济大学导论类课程建设与教学实践《数据科学通识导论》课程总览数据科学通识教育16个字实践1. 建立对话、激发思辨对话与思辨2. 协作交流、动手实践实训平台即服务(作为一种基础设施)演 示作业管理与课程管理《大数据原理与实践》课程总览容融入Google的的大数据技术、工具和平台近期的重点工作思考与总结Thanks