用拓扑数据分析法研究大数据

拓扑数据分析是拓扑学和数据科学相结合得到的技术,它被广泛应用于计算几何学问题,在生物学和医学领域也同样被广泛应用。今天小编想要向大家介绍一下翰林国际教育的一个学研项目:【科研论文】走进大数据之拓扑数据分析方法。

拓扑数据分析介绍

拓扑数据分析(Topological Data Analysis, TDA)是拓扑学和数据科学相结合得到的技术,按定义,TDA是以持续同调(persistent homology)为基础,对数据的拓扑学特征(topological features)进行分析的方法。TDA的一般性目的是从高维数据中提取有效信息,按机器学习观点属于非监督学习和表征学习。其分析过程不会引起信息的损失,且被认为对缺失和噪声样本稳定。由于TDA的分析对象是独立于度量(metric)的拓扑学特征(按一般用语可表述为“抽象的形状”、“点与点之间的关系”),因此TDA能够整合并协同分析不同度量(坐标)下的数据集。TDA被应用于计算几何学问题,例如3D扫描器输出的点云(point cloud)数据的分析、重建和可视化。在生物信息学和医学领域,例如癌症基因样本的研究中也有应用。

【科研论文】走进大数据之拓扑数据分析方法

适合学生
高中生、本科生、研究生(国内外均可)
适合专业
数学/应用数学/大数据/数据科学
项目形式
每个课题配备海外名校教授、课题助教、Mentor共同作为导师
课题简介
在过去的几年里,商业、科学和技术的许多进步都依赖于深度学习和人工智能的惊人进步。这些成就更加彰显了在各种实际情况下产生的大数据分析、提取和应用的重要性。拓扑数据分析(TDA),顾名思义,就是把拓扑学与数据分析结合的一种分析方法,用于深入研究大数据中潜藏的有价值的关系。拓扑学研究的是一些特殊的几何性质,这些性质在图形连续改变形状后还能继续保持不变,称为“拓扑性质”,而在复杂的高维数据内部也存在着类似的结构性质。相比于主成分分析、聚类分析这些常用的方法,TDA 不仅可以有效地捕捉高维数据空间的拓扑信息,而且擅长发现一些用传统方法无法发现的小分类,具有更大的研究价值。在本课程中,教授将带领大家学习基本的拓扑数据分析知识,并讲述更多实际应用案例,在理论与实践相结合的基础上,帮助学生实现学以致用。
本课程主要目标包括:
★ 学习拓扑的基本理论和技术
★ 拓扑理论在数据科学领域的实际应用
★ 通过问题的解决,提升自我科研分析能力,扩大知识理解范围
★ 如何进科学调研以及如何撰写科研报告和学术文章
课程安排
week 1: 拓扑数据分析的一般原理;Metric spaces 度量空间
week 2: 拓扑概念I;拓扑概念II
week 3: 相关问题和解决方案
week 4: 科研报告:基本原则和选题分析;持续同源性
week 5: 拓扑数据分析的实际应用I;拓扑数据分析的实际应用II
week 6: 总结和科研报告展示
【科研论文】走进大数据之拓扑数据分析方法的相关内容就介绍到这里了,由于名额有限,感性趣的同学赶快来报名参加吧。

更多学研项目

翰林国际教育资讯二维码