西北大学科研课题:深度学习在文本自动生成与自然语言翻译中的应用

描述

西北大学科研课题

深度学习在文本自动生成与自然语言翻译中的应用

课题简介

深度学习 (Deep Learning) 是目前人工智能最重要的组成部分,是一种由复杂结构(多重非线性变换)构成的多个处理层对数据进行高层抽象的算法。人工智能作为二十一世纪关键技术之一,已经成为全球经济迅猛增长的源动力。深度学习根据其应用分类,可以分为监督学习(分类,回归),非监督学习(聚类,异常值检测)与强化学习(AlphaGo,自动驾驶等)三大类。深度学习是一门交

叉学科,损失函数的优化需要应用数学支撑,代码实现与GPU运算需要计算机科学支撑,模型设计需要统计学支撑。随着信息技术的发展,越来越多的领域都离不开深度学习与人工智能。

随着人类社会的发展,越来越多的新发明受到人们的关注。如谷歌,百度,特斯拉等等公司都在着手研发自动驾驶技术,百万年薪在这一领域已是稀松平常,当今IT公司追逐人工智能风潮的决心可见一斑。拥有顶尖人工智能技术的公司股价连创新高,深度学习已成为当今社会最前沿与重要的技术之一。

作为一个交叉学科,深度学习与人工智能要求较强的理工科背景:数学,统计学知识帮助理解深层次的原理,计算机知识则是搭建软件框架的必要背景。在具体的研究上学生还需要有较强的建模能力从而更好地对模型进行设计。

自然语言处理是深度学习与人工智能领域中的一个重要方向。它涉及人与计算机之间用自然语言进行有效通信的各种理论和方法。 自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言 。其中,文本生成的应用数不胜数,比如训练计算机创作诗歌,剧本,歌词,小说,代码,甚至严格的数学证明。而语言翻译则侧重于理解两个语种之间的关联与区别,如百度翻译,谷歌翻译,都使用了深度学习中前沿的自然语言翻译模型,从而达到令人吃惊的准确率。本次课题我们将设计不同的深度学习模型并且应用于自然语言处理问题。

科研方法

AI+X数据驱动型科研

使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。

AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。

但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。


授课导师

西北大学 统计学专业博士
1、西北大学统计学专业博士,因本科阶段满绩点的成绩获全额奖学金;
2、曾参与“应用机器学习方法检测埃博拉病毒的早期变异”、“SARS病毒传播方式的敏感性分析”等多个前沿研究;
3、大二时即在中国核心期刊中发表论文;
4、擅长数据挖掘技术在其他领域的应用,并曾使用人工智能的方法研究过经济、卫生等多个领域的问题

课题要求

本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力:

英文:
1、具备基本的学术英语阅读能力;
2、接触过英文写作,有论文写作经验者更佳;

 

数学:
1、线性代数基础知识;
2、概率统计基础知识;

 

计算机:
Python编程基础。

咨询请添加顾问老师

翰林国际课程咨询二维码