冠军
数据+人工智能

数据领导者为数据驱动创新提供动力

第4集

教育如何改写虚拟学习

自COVID-19大流行开始以来,教育机构不得不迅速转向完全在线教学。在本节课中,新南威尔士大学悉尼分校的首席数据和洞察官Kate Carruthers讨论了她是如何帮助该大学转变为数据驱动型组织的。凯特和她的团队正在为教师和学生提供新的见解,迅速将试点应用程序转移到生产中,并创造创新的方法来应对挑战学生和大学之间道德准则神圣性的新威胁。

凯特·瑟斯
首席数据和洞察官
悉尼新南威尔士大学
Kate Carruthers是新南威尔士大学悉尼分校的首席数据和洞察官,也是计算机科学与工程学院的兼职高级讲师。她是一名注册信息安全经理,目前正在攻读恐怖主义和网络安全研究生课程。

凯特在金融部门、营销、数据和数字领域的ICT高级职位上拥有丰富的经验。她是新南威尔士州政府数据分析中心顾问委员会的成员。凯特因其在2020年在网络安全方面的工作而被任命为微软区域总监计划(这是一个外部顾问角色,为微软领导者提供客户见解、现实世界的声音和见解)。

她目前在数据分析、AI、ML、隐私、网络安全和数据保护的交叉领域工作。

阅读面试

演讲者1:
欢迎来到Databricks为您带来的数据+人工智能冠军。在每一期节目中,我们向数据+人工智能的捍卫者致敬,他们正在改变现状。这些“特立独行者”正在重新思考数据和人工智能如何增强人类体验。我们将深入了解他们的挑战,庆祝他们的成功,同时更深入地了解这些领导人。

克里斯·达:
欢迎来到数据+人工智能的冠军。我是主持人,克里斯·达戈斯蒂诺。COVID-19在全球范围内产生了前所未有的影响,几乎影响到我们生活的方方面面。在数据和人工智能的世界里,它迫使许多组织立即进行数字化转型。对于小学、K-12和大学等教育机构来说,他们不得不在短短几周内转向完全数字化教学。

克里斯·达:
今天,我请来了澳大利亚悉尼新南威尔士大学的首席数据和洞察官Kate Carruthers。凯特讨论了她多样化的职业、教育和人类学如何帮助她将大学转变为一个数据驱动的组织。凯特,欢迎。很高兴今天能请到你们。所以,教育真的是一个有趣的主题,特别是考虑到世界上发生的一切都与COVID有关。到今天为止,已知的病例超过1亿例。新冠疫情改变了各行各业。在某些情况下,那些不能适应新环境的组织和公司已经倒闭了。其他人则不得不迅速进入数字化前沿,进入虚拟环境。大学也是如此。 And so, I’d like to just get your response to like how has the last year been for you?

凯特瑟斯:
嗯,我们的机构,像其他所有人一样,不得不应对封锁和人们无法上学的问题。去年年初,我和计算机科学与工程学院的一些同事聊天,他们说:“我的课程很特别,很独特。它永远不能上线。”三周后,这门课程就上线了,就像我们去年开设的每门课程一样。因此,COVID极大地推动了大学等大型国家机构的数字化步伐。这是为了应对在新冠疫情封锁期间教育学生的需求

克里斯·达:
至于那些课程,比如一些以讲座为基础的课程,我想显然更容易转移到网上。那化学这门课呢,需要用到仪器和实验室工作,你是怎么处理的?

凯特瑟斯:
这对我们来说确实是个挑战因为我们有很多课程,尤其是工程学。我在工程学院有个学术任命,所以我很清醒。我们有很多在实验室里要做的事情。你需要亲自到场,而学生不这样做就不能毕业。所以,我们只是把这个问题踢到了后面,我们假设今年我们能够让学生们回到教室,使用安全距离程序来应对COVID。去年年底我们做了一些。所以,在澳大利亚,新冠病毒的数量非常低。所以,我们现在可以把我们的学生带回实验室。课程讲座仍将保持在线,但实验室将从今年开始。

克里斯·达:
哦,所以也许也许如果在过去的一年里有很多讲座,也许一旦学生回到校园,他们错过的实验室工作,也许你会更专注于前进。

凯特瑟斯:
是的,这是我们的想法。虽然在医学方面,我们在过去几年里一直在做一些实验,比如我们在很多课程中不使用显微镜,因为当你用显微镜做实验时,每个人的样本都略有不同。所以,我们所做的就是使用数字样本,这样他们都能看到相同的东西,挑出相同的特征。所以,多年来这是一件有趣的事情,但你仍然不能取代面对面的实验室。如果你在做土木工程,你需要碾碎混凝土,你真的需要这样做。你不能想象,也不能在电视上看到。

克里斯·达:
凯特,你提到过澳大利亚的病例量通常很低,但政府和国家已经采取了一些预防措施,以确保保持这种状态。当你开始重新开放时,你回顾了过去的一年,你在大学里的角色因COVID而发生了什么变化?

凯特瑟斯:
有趣的是,它并没有。我们不得不做的是,我们必须重新剪辑我们的很多报告来提供见解。我们遇到的情况是,我们的国际学生,我们收入的很大一部分,无法进入这个国家。所以,我们不得不让他们在线学习。我们需要了解谁在这个国家,谁不在这个国家。我们以前从来不用担心这个因为学生们习惯在学期的第一天就来上课。

凯特瑟斯:
但我们必须弄清楚人们在哪里,因为校园里没有人。所以我们不得不重新剪辑很多报告,为人们提供新的见解。这对我们来说很有挑战性。更普遍地说,我认为在高等教育领域,大学很舒服,不太数字化,但COVID现在有点像涡轮增压,因为我们都必须,我们都必须面对我们需要在线授课的事实。所以这对我们这些机构来说是一个重大转变,但我的工作并没有因为新冠疫情而改变,只是让一切都以指数级速度增长了。我想很多人已经发现,关于COVID,它使这种转变呈指数级增长。

克里斯·达:
凯特很想让观众多了解一下你的背景,你的职业生涯,在我们第一次认识的时候,我发现很有趣的一点,你通往你现在的职位和你现在的领导职位的道路,可能不是你传统的计算机科学道路。所以,我很想听听你的背景,一些人们不会在你的领英简介上看到的东西。

凯特瑟斯:
嗯,也许我是在本科的时候开始的,我是一名艺术系的学生。所以,我在做历史,人类学和哲学。这对我来说可能是最重要的事情,因为它真正形成了我沟通、写作和思考的能力。我是在大学毕业后去工作的时候才开始接触电脑的,我发现我和电脑很亲近,开始越来越多地接触电脑。我在IT行业的第一份工作是因为我在国家信托基金的厨房工作,这是一个负责建筑和其他东西的慈善机构。我向公司的老板和首席执行官提到了电脑系统的问题。她说:“你想当负责人吗?你听起来好像知道自己在做什么?”我说:“是的。”

克里斯·达:
然后,你必须打开所有的手册,阅读它,或者你只是边做边学?

凯特瑟斯:
我在工作中真正学到了东西。我一边看书,一边给小贩打电话,让自己看起来很讨厌,但我真的很喜欢。然后,我进入了银行业。最后我去了花旗银行,我的职业生涯也从那里开始。我从事了20多年的IT工作。我为一些大型金融服务机构做了很多关于数据仓库的项目。这就是我开始研究数据的原因。我也做过一段时间的数据库管理员。所以,我在IT部门做过大量的工作。所以,我为这个角色带来了非常广泛的技术经验。 But I think too, my academic studies have all been in business and management. So, I bring a fairly unique perspective across of business as well as technology and being able to marry the two is probably the most important thing.

克里斯·达:
是的。我想你的人类学背景会让你对理解根本原因分析感兴趣比如是什么触发了停机或者是什么触发了数据以某种方式使用?就像回顾过去,这在多大程度上起了作用?

凯特瑟斯:
哦,因为我曾经在通用电气工作,我是那里的六西格玛黑带。我的大脑会自动默认这种想法。所以,在我的职业生涯中,我带来了很多影响。我经常做类似六西格玛的事情,但我不告诉别人我在做六西格玛。

克里斯·达:
就像绝地武士的心术一样。凯特,现在我要具体谈谈数据和人工智能,以及它在大学里是如何使用的,以及你如何使用数据来确定学生的参与度,在线课程的成功,以及学生如何能够使用为他们创建的数据,他们的成绩和他们的参与度水平,来确定学生是否在正确的轨道上,以及诸如此类的事情。那么,总的来说,数据和人工智能是如何影响这所大学的,你又是如何管理那里的学生群体的?

凯特瑟斯:
我们最初的数据战略(从2019年持续到2020年)都是关于在我们新的Azure数据平台上建立基础。bob体育客户端下载所以我们就这么做了。现在,我们期待着从2021年到2022年的新数据战略,这是关于使用人工智能和机器学习来提供见解,对概念进行各种证明。我刚刚和那些负责我们教学和学生体验的人聊过,就在这次会议之前,我们已经规划了一些与学生和学者共同设计的研讨会,在那里我们将共同创造我们向他们传递信息的方式。所以,我们一直在做传统的事情,在学习管理系统中,你可以展示东西,这有点原始,有点难以达到。我们将以David Kellermann博士所做的大量工作为基础,他将Power BI仪表盘以团队形式交付给学生,我们将与学生共同创造它。所以,我们要创造他们真正想看的东西。我们还将围绕有风险的学生做一些工作。所以,这就是有学业失败风险的学生。我们希望能够确定一个学生的特征谁将不及格的课程,以及谁的学生有自残的风险。 So, we’re trying to build up some data points that we think contribute to both of those and we’re going to be then co-creating the dashboards and the insights with the students and the staff.

克里斯·达:
当我们第一次见面时,你谈到了在整个大学和大卫·凯勒曼(David Kellermann)中寻找数据和人工智能对大学有用的例子,然后加速扩大这些计划的规模。你还能想到其他的例子吗你在大学里看到过一些东西你认为如果我们在大学里所有的项目中做这个会很好,需要和教职员工合作,得到支持和支持。

凯特瑟斯:
我认为目前高等教育面临的最大挑战之一,尤其是现在我们都在网上,是一种叫做合同作弊的东西。这就是学生付钱请人给他们写一份独特的作业。他们不仅违反了学生行为协议,而且毕业后还会被这些人勒索。所以,这是一件伴随他们一生的事情,这对我们来说是有问题的,因为我们可能会授予那些没有完成工作的学生学位,而且学生也会被勒索。所以,我们现在正在做一个概念的证明,我们正在分析我们的历史数据,我们有一个假设,我们可以识别它。那么,我们正在寻找已知的…我们能找到所有已知的与合同欺诈有关的历史行为吗?如果可以,我们就可以把它应用到未来。我们的目标是,我们想要确定一个学生什么时候有这样做的倾向,并在他们这样做之前进行干预。

克里斯·达:
有趣。

凯特瑟斯:
所以,这是我们目前正在做的事情。

克里斯·达:
那么,这有点像监督学习吗?所以,你拿已知的案例,你试着训练一个算法或者说是训练一个模型,然后,当你收到新的数据和提交的新任务时,你现在要寻找这些提交的数据中可能匹配的特征?

凯特瑟斯:
是的。

克里斯·达:
好的。酷。非常酷。

凯特瑟斯:
没错,就是这样。所以,我们有一个假设,我们要运行它。我们正在和历史数据进行比对看看能不能找到已知的实例。所以,我们有一个团队在寻找这个。所以,他们确实会找到有这种行为的学生,然后开除他们。我们有一些已知的例子。所以,如果我们能在历史数据集中找到已知的实例,就能证明假设是有效的。然后,我们可以使用历史数据来训练ML。然后,我们可以展望未来。然后,我们要做的就是试着找出哪些是前驱行为。那么,我们能识别出行为,但我们能在他们真正做之前识别出前兆行为吗?

克里斯·达:
太好了。那么,您是否使用Azure Databricks来帮助进行一些数据分析呢?

凯特瑟斯:
哦,是的,的确如此。是的。是的。我们正与澳大利亚的Databricks团队密切合作,因为我们差不多是在两年前建立了Databricks,我们意识到最佳实践在不断发展。因此,我们目前正在重新构建我们的数据库,这样我们就可以优化我们为新世界所做的事情,因为我们两年前所做的事情实际上是关于报告。现在更多的是关于人工智能和机器学习。所以,我们想重新思考我们是如何实现Databricks的。

克里斯·达:
很高兴听到它实际上是在努力改善学生的生活,并防止大学里的欺诈和不诚实行为。所以,其中一些肯定来自于你的银行业背景。我有银行业的背景。在加入Databricks打击金融欺诈之前,我们在以前的生活中使用过Databricks。所以,我很想听听你的一些想法一定是提前提出的。那么,你如何看待你正在研究的一些创新,这些创新是否适用于更广泛的全球大学环境?

凯特瑟斯:
是的,我在银行业的经历确实影响了我对这个问题的思考。有趣的是,你在不同行业的不同经验,如何真正被用来为你在不同行业的经验提供信息。所以,我真的这么做了。当行为和诚信团队来告诉我他们有这个问题时,我立刻想到这与银行欺诈有直接的相似之处。我以前在信用卡行业工作,那里有很多欺诈行为。因此,我们有非常复杂的欺诈跟踪和分析。所以,我有很多想法,但那是10年前我做的事情。所以,现在的技术发展得如此惊人,我们可以用人工智能和机器学习来检测这一点,当我回到银行的时候,我很喜欢这一点。所以,我们现在有很好的工具和技术可以用来识别它。这是ML要解决的一个大问题因为它都是关于模式匹配的。 So, that’s really exciting.

克里斯·达:
就这些创新和用例而言,你认为它们能更广泛地适用于全球的大学和教育吗?

凯特瑟斯:
是的,真的很有趣。当我们谈论欺诈检测的时候,我们必须非常小心,不要泄露我们正在做的事情,因为欺诈者会看着我们,听着我们,如果他们知道我们在看特定的东西,他们会改变他们的行为。所以,我们必须非常小心,但我们确实定期会面。所以,澳大利亚和国际上的所有大学,我们过去都是面对面见面,但现在我们通过Teams或Zoom见面,但我们确实会私下见面讨论这个问题。我们也分享我们的发现和经验教训。这很重要,因为我们所有人都比一个人聪明。通过分享这些知识,我们都可以改善我们的实践。我们真的认为这很重要。

凯特瑟斯:
高等教育部门尤其注重合作。所以,我们是竞争对手,但我们也经常合作。因此,我们定期与国际和国家机构会面,我们确实分享一些东西,但你不能总是直接将一种经验推广到另一个地方,因为他们通常没有相同的技术。就像很多大学并没有把所有的数据都放在一个整洁的数据湖里,旁边还有一个精心策划的数据湖里。

凯特瑟斯:
所以他们没有这个优势。所以,他们中的很多人都需要建立这样的平台,而我们花了两年的时间来建立我们的平台,把我们的数据整理好。bob体育客户端下载现在我们可以很容易地在数据集上运行ML。这就是为什么我们花了两年时间来做这件事,因为如果你把所有的数据都排好了,那么你就可以在上面做人工智能和机器学习。然而,如果你的数据到处都是,你不知道它是什么,你不理解它,你不清楚它,那么你就很难做到这一点。这就变成了一个非常昂贵的练习。

克里斯·达:
是的,我们和很多客户谈过,我确定Databricks已经涉足了不同的垂直领域。我们在与这些客户交谈时听到的一件关键事情是,做ML的愿望完全取决于数据的质量和数据的数量。因此,我们为我们所做的一些创新感到自豪,这些创新帮助人们以原始格式获取数据,并为他们提供一组真正一致的api,以便管理数据并改进数据,以便可以使用。

凯特瑟斯:
这是绝对基本的。因此,我们使用Azure数据工厂出借数据,然后使用Databricks清理、转换并迁移到数据仓库和策展数据湖。对我们来说最大的教训可能是我们认为我们的数据科学家想要使用原始数据湖中的原始数据。实际上,他们需要精心策划的数据。我给你们举个例子。所以,我们为那些想上大学的人提供offer,我们提供有条件的offer。所以,我们可能会对你说,“你可以来和我们一起学习,但你必须证明你的英语水平达到标准。所以你需要给我们看你的英语成绩。”所有这些有条件的出价都发出去了。现在,数据科学家,他们为所有这些报价提供了随机的字母数字代码。

凯特瑟斯:
他们需要把这些代码整齐地打包成一种叫做有条件报价的类别,因为他们不知道所有这些代码。所以,我们真正意识到的是,数据科学家实际上需要一个数据湖中的数据,这样他们就能在一定程度上组织起来,这样他们就能真正地理解它。这对我们来说非常重要。这是一个巨大的打击,因为我之前听到的都是他们想要原始数据。他们不想要原始数据。他们希望给数据附加一些意义,但他们希望能够访问这些数据。

克里斯·达:
你看,我的意思是,凯特,听起来你花了几年时间来建立数据平台,提供原始数据,或者像你所说的,与你社区中的数据科学科学家一起,想要那套精心策划的数据。bob体育客户端下载只是一个平台,然后平bob体育客户端下载台化,能够接收数据,通过一组管理步骤移动数据,然后为这些下游用例提供数据。所以,听起来你肯定很忙,你有一些有趣的工作要做。

克里斯·达:
现在我想换个话题,谈一谈那些有志于做你这样的角色的人,那些想领导数据和人工智能组织的人,你会给他或她什么建议,让他或她在职业生涯中寻找什么?要寻找什么样的机会?因为正如你所说,你来自非计算机科学的背景,但你把批判性思维与一些商业技能和一些银行背景结合在一起。你已经能够将所有这些信息应用到你所获得的角色中,很想听听你会给年轻的自己或有志于走上数据和人工智能职业道路的人什么样的建议。

凯特瑟斯:
实际上,我的建议是,找一份和聪明、善良的人在一起的有趣的工作,因为你会发现,如果你做这些事情,如果你在找一份和聪明、善良的人在一起的有趣的工作,你会在那种环境中学到很多东西。我也建议你说“是”。对稍有偏差的机会说“是”。这就是我如何结束我的第一个数据仓库项目。我对数据仓库一无所知,但我同意了,这是我的第一个数据仓库项目。我发现这真的很有趣。我还发现我是世界上最糟糕的元数据建模师,但那是另一个故事了。但如果你对听起来有趣的事情说“是”,并尝试与聪明、善良的人一起工作,这就是我看到的。

克里斯·达:
你认为三到五年后,数据和人工智能将在教育领域走向何方?

凯特瑟斯:
所以,我不仅仅是大学的首席数据和洞察官。我也是计算机科学与工程的高级讲师。我刚刚完成了关于数字化转型和高等教育的硕士论文。所以,我对此有自己的看法。我认为我们走的是一条完全不同的路。所以,我们不想让学生觉得他们需要盯着讲课。事实上,我们正试图重新思考讲座的本质。我们正试图重新思考如何进行教育,如何参与,以及如何将内容分解。所以,我在某种程度上预测,这个讲座可能不会以目前的形式存在太久。有趣的是,几年前我和一个机械工程的同事做了一些工作,我们学习了所有的内容,你需要学习这些规则并能够将这些公式应用到这些事情上。

凯特瑟斯:
我们把这些都带出了教室。我们把它数字化,分成小块,我们把课堂体验转变,我们剩下的是,哦,当你没有任何内容可以教他们的时候,你在课堂上做什么?嗯,实际上,你开始和他们一起做小组工作,这就是你在现实生活中所做的。所以,我们开始尝试用新的方法来教授旧的材料。所以,工程学是一门很好理解的学问。有非常传统的教学方法,但我们刚刚开始重新想象和思考。人工智能会让我们看到学生们是如何与所有的材料,所有的内容互动的,我们将能够在飞行中重新校准这些材料。这是建立在David Kellermann博士和我另一个同事的研究基础上的。

凯特瑟斯:
所以,我想象的未来是,我们会把他们学到的东西分成更多的部分,然后一点点地传授给他们。我们会重新校准这些咬痕。像小测验和测试,我们会把这些都自动化,因为我讨厌打分。所以,我们要,我的梦想之一是让手记消失。大卫做了很多工作来自动标记手绘图。所以,学生可以用纸笔画画,然后上传,我们可以自动标记。

克里斯·达:
有趣。

凯特瑟斯:
所以,我们要去掉很多老师过去在打分和其他方面所做的劳动,并将其重塑为我们与学生的互动,因为学生实际上是因为这些工作人员才上大学的。他们来这里是因为他们想和这些很棒的老师在一起,他们没有太多的互动。他们被动地坐在教室里。他们被动地坐在那里,不投入。实际上,我们希望他们身体前倾,参与其中,与老师互动,而不是被动地坐着接受讲座。所以,我认为教育在未来会以非常有趣的方式被重塑。这一切都将由人工智能和ML以及有趣的数据驱动技术实现。这也是我开始研究数据的原因之一,因为我可以看到,数据支撑着我们正在经历的数字化转型。我真的认为,现在任何非数字化的业务都可能已经死亡。所以,我真的看到了教育的一个有趣而令人兴奋的未来,但它需要由健全的教学原则驱动。

演讲者1:
感谢您收看本期由Databricks为您带来的数据+人工智能冠军节目。成千上万的数据领导者依靠Databricks来简化数据和人工智能。因此,数据团队可以更快地创新,解决世界上最棘手的问题。访问www.neidfyre.com,了解数据领导者如何释放所有数据的真正潜力。