国际竞赛 | Kaggle数据科学竞赛

Kaggle数据科学竞赛

 

谷歌旗下的 Kaggle 是一个数据建模和数据分析竞赛平台。该平台是当下最流行的数据科研赛事平台,其组织的赛事受到全球数据科学爱好者追捧。 如果学生能够在该平台的一些比赛中获得较好的名次,不仅可以赢得大量的奖金,还可以收获Google、Amazon等知名互联网公司的面试邀请。同时,学生在kaggle上的排名也能体现学生在数据科学、人工智能学科方向上强烈的兴趣,进而在学生申请和未来就业的过程中,帮助学生展现自己在编程和算法上的竞争力。

 

学习数据科学是深入了解人工智能 (AI) 的必经之路。数据科学是机器学习的基础,而机器学习是人工智能最核心的算法实现方式。

 

为什么要参加Kaggle数据科学竞赛

 

Kaggle 是展现学生数据科学学术能力的极佳渠道。现在,数据科学、人工智能算法领域的学者以及从事数据相关行业人士都会在学习工作之余在 Kaggle 上参加自己感兴趣的比赛,同业内人士进行交流学习,提高自己的专业水平。

 

除了算法专家之外,有越来越多其他学科方向的学生和从业人员想要通过数据科学的方式提高自己使用算法解决问题的能力。这些学科既包括理工科(物理、化学、工程、环境、能源等)和社会科学(经济学、心理学、社会学)也包括文学、历史学和人文学科。

 

 

科研方法

 

AI+X数据驱动型科研

AI+X数据驱动型科研 是指使用人工智能 (AI) 算法,收集、处理、分析具体学科 (X) 的数据,并基于此进行预测,从而获得科学发现的研究方法。AI+X数据驱动型科研已被广泛地应用于各个领域,如物理、化学、生物、工程、心理学、社会学甚至文学。

 

与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。以AI算法预测染色体中的癌症基因为例:使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。

 

 Kaggle竞赛举例

 

 

旧金山犯罪分类问题研究

该比赛由Kaggle平台主办。比赛通过研究在旧金山发生的犯罪事件、犯罪地点和犯罪时间来对旧金山的犯罪情况进行分类。在有方的配套课程中,学生将会通过数据可视化、机器学习分类算法入门和进阶等课程实现犯罪分类预测。

 

该比赛涉及的相关学科有:数据科学、机器学习、城市研究、犯罪学。犯罪是社会的现象之一,研究犯罪将能为有效地减少、预防和预测犯罪做贡献。

 

通过参与该比赛,学生将展现出对犯罪问题的研究和关注,并且展现出使用计算机方法对犯罪问题的分类预测能力。

 

 

共享单车分布研究

该比赛由Kaggle平台主办。通过收集分析共享单车骑行时长、出发地点、到达地点等骑车数据来预测共享单车在华盛顿特区的运行情况和市场需求。在课程中,学生将通过数据可视化、机器学习回归算法入门和进阶等课程预测共享单车市场需求。

 

该比赛涉及的相关学科有:数据科学、机器学习、城市研究、共享经济。共享单车在各个城市大力发展的同时,也带来了停车难,停车乱等社会管理问题。

 

参与该比赛的学生展现出对社会热点和新生公共事物的关注,并且展现出用前沿的计算机方法解决社会热点问题的能力。

 

 

奔驰环保测试优化大赛

本次比赛由梅赛德斯-奔驰赞助,在 Kaggle 平台上进行,旨在开发一套算法以 缩短奔驰汽车在工厂中进行测试的时间。该比赛吸引了来自全球的近四千支参 赛队伍竞争总计 25,000 美元的奖金。课程中,学生将通过数据可视化、机器学习回归算法入门和进阶等课程完成优化测试。

 

该比赛涉及的相关学科有:数据科学、机器学习、环境科学。

 

参与该比赛的学生不仅展现出自己关注时事的态度——在中学阶段就已经具有极强的社会责任感和人文情怀,而且彰显了自己不只满足于书本知识的学术好奇心,用前沿的科研思维设计精巧的算法,来解决自己在现实中发现的问题。

 

 

竞赛指导成果

 

成果1

竞赛指导排名

参加有方Kaggle数据竞赛指导的学生将在有方的帮助下将课程成果上传至Kaggle参与全球排名。顺利完成课程所有学习内容的学生将可以在Kaggle的竞赛排名中达到至少前50%及以上的名次,超过大部分行业内和学界的数据科学家。如果学生在课程中和课后愿意投入更多时间,那么排名结果将会更优秀。以有方指导成果为例,在数十位完成比赛的学生中,有多位学生达到前30%的竞赛排名,表现出色的学生甚至达到比赛前15%和5%。

成果2

学术能力提升

参加Kaggle竞赛指导的学生将接触到计算机人工智能方向最前沿的研究方法和算法知识。在课程中,学生将在导师的指导下,通过项目制的学习方法亲自动手编写代码。除了完成课程学习和竞赛辅导之外,本次辅导还能帮助学生更好地掌握AP、IB、A-Level等计算机科学、统计学和数学的课程内容。

成果3

证明自我驱动力,为申请助力

Kaggle作为世界上最大的数据科学交流竞赛平台吸引了众多数据科学家、研究人员甚至业内知名人士参加。如果学生作为高中生就能和这些参赛者同台竞技,这一定会成为申请材料中亮眼的一笔。

 

 

录取流程

 

Kaggle数据科学竞赛项目采取审核制招生制度,每个课题每期至多录取两组学生,我们将通过两轮面试评估课程匹配度,以确定最终入选的学生名单。

 

适合学生

 

  • 有志于申请美国前50名大学的9-12年级学生;
  • 对人工智能和机器学习算法感兴趣;
  • 有志于就读计算机、数据科学专业,从事相关领域工作;
  • 对于学生在专业领域的基础没有要求,我们会提供学术知识培训帮助学生入门相关专业。

 

 

 

人数

费用

一人参赛

22,500 元;

二人参赛

21,000 元(每人),需由学生自行组队并同时进行课程;

三人参赛

19,500 元(每人),需由学生自行组队并同时进行课程;

 

翰林国际教育资讯二维码